本文へスキップ

2018/10/17 -News-
タイトル背景

こんにちは! 曽布川です!

久しぶりの記事投稿になります。
後期が始まり、半月が立ちました。
今回は私の卒業研究について話したいと思います。



前回の研究記事にて、「マルチモーダル」を取り組むということで進めていました。

それから、様々なことを調べていく中で、「画像による文字認識」に興味を持ちました。

「文字認識」は写真や紙など様々なモノに書かれている文字を、
一つずつ切り取り、切り取った文字に対して、
登録済みの文字を当てていき、一番に形に近かったものを判定して、文字を確定します。

画像認識の精度が向上したことによって実用的に利用できる場面が増えてきています。
スマートフォンアプリで、カメラで映した部分の文字を読み取り、テキストファイルに記述するものも出ています。

それを利用して、カメラで映した文字をデータベースに登録する事できるのではないかと考えました。
さらにカメラと言ってもスマートフォンのみに限らず、スマートグラスやロボットなど、様々なモノにカメラが搭載されています。
これにより、手を使わずに入力を行うこともできるのではないかと考えています。


そのようなことを考え、現在は文字認識の技術の勉強として「Android studio」の勉強を進めています。
「Android studio」とは、アプリ開発向けに作られた統合開発環境です。
その中には、文字認識を行うためのライブラリや音声認識を行うためのライブラリなどがあります。
さらに、スマートグラスやロボットへのプログラム記述も可能になっています。


まだまだ理解できていないことも多いですが、早く理解してから、研究に取り組んでいきたいと思います。






大学ロゴ