理大の栞理大50周年



その25[読めますよね・・・]  解説

 

最近,電子書籍の話題をよく目にするようになりました。電子書籍をインターネットから有料でダウンロードし,携帯端末でいつでも読むことができます。中には,販売されている電子書籍をダウンロードするだけでは物足りず,自分の本をスキャナーで読み取り,デジタル化して持ち歩く人も見受けられます。自分でデータを吸い出すことから,これを通称“自炊”と呼んだりもするようです。

さて,この“自炊”,本をスキャナーで読み取ったままでは,写真を撮ったのと同じで,ただの画像データにすぎません。たとえば,ある言葉がどこに出てくるかを検索したいなら,画像の中にどんな文字が含まれているかを知る必要があります。そこで活躍するのが,パターン認識技術の中の一分野である文字認識技術です。

画像から文字を読み取る仕組みは,OCR (Optical Character Recognition, 光学文字認識) と呼ばれます。OCRはまずページ全体を眺め,傾きや明るさを補正し,文字の領域,図の領域などのおおまかなレイアウトを割り出します。そして,文字の領域から1文字ずつ切り出しては,自分が持つ手本文字一覧と照合して何の文字かを特定していきます。最近は,いろいろな字体が混ざっていても,普通の活字なら十分な精度で読んでくれるようになりました。しかし,手書き文字となると,文字の形や大きさや間隔がまちまちなので,OCRの性能は大きく低下してしまいます。

それなのに,人間はなぜ,ほとんど苦労なく文字を読めるのでしょうか?では,次の文をぱっと読んでみてください。

おやかま へ よこうそ!

よく見ると間違っているのに,読めてしまいます。人間は,文字の切り出し,照合だけでなく,意味の理解も高度に働かせながら文字を読んでいることがお分かりでしょう。1文字ごとに切り出して読むOCRの仕組みと,直観的に読む人間の仕組みの間には,大きな隔たりがあるのです。これが,コンピュータによる文字認識が簡単ではないことの理由です。文字認識技術は古くから研究されていますが,まだまだ挑むべき課題の多い,発展途上の技術なのです。

では最後に。果たしてOCRは,栞に書かれた謎の文字を読めるのでしょうか!?試してみたら,OCRは自信を持って次のように答えました。

'帽.司占:l4

OCRが

を見事「LIFE」と答えてくれるのは,いつの日でしょう。

 

提供:工学部 情報工学科 島田 英之 先生

ページTOP

岡山理科大学 kouhou(atmark)ous.ac.jp 086-256-8412
Copyright (C) Okayama University of Science.