役立つ情報を
あなたのポケットに!

その25:読めますよね・・・

▼解説▼

最近,電子書籍の話題をよく目にするようになりました。自分の本をスキャナーで読み取り,デジタル化して持ち歩く人も見受けられます。しかし,本をスキャナーで読み取ったままでは,写真を撮ったのと同じで,ただの画像データにすぎません。たとえば,ある言葉がどこに出てくるかを検索したいなら,画像の中にどんな文字が含まれているかを知る必要があります。そこで活躍するのが,パターン認識技術の中の一分野である文字認識技術です。

画像から文字を読み取る仕組みは,OCR (Optical Character Recognition, 光学文字認識) と呼ばれます。OCRはまずページ全体のレイアウトを割り出します。そして,1文字ずつ切り出しては,何の文字かを特定していきます。OCRは,以前からすればとても高性能になりましたが,それでも人間にはとてもかないません。では,次の文をぱっと読んでみてください。

おやかま へ よこうそ!

よく見ると間違っているのに,読めてしまいます。人間は,意味の理解も高度に働かせながら文字を読んでいることがお分かりでしょう。1文字ごとに切り出して読むOCRの仕組みと,直観的に読む人間の仕組みの間には,大きな隔たりがあるのです。文字認識技術は古くから研究されていますが,まだまだ挑むべき課題の多い,発展途上の技術なのです。

提供:工学部
情報工学科
島田 英之 先生

答を見る

ページTOP

[リンク]
栞の一覧に戻る
岡山理科大学(携帯)
岡山理科大学
kouhou@ous.ac.jp
086-256-8412
(c) Okayama University of Science