ハンディターミナル入門

ハンディターミナルの基本機能

トップへ戻る

第4回 読み取り(OCR文字)

 今回はOCR文字読み取り、極めて一業界に特化しておりマニアックなお話となります。
OCRとは画像として読み取った情報のパターンを分析し、文字情報を識別して読み出す仕組みです。ハンディターミナルでは特殊な専用フォントで印刷されたアルファベットや数字、記号が読み取れます。WindowsでもOCRBというフォントが存在し、これがハンディターミナルで読み取り可能なOCR-Bにあたります。

OCRを読み取りコードとして採用するには問題があります。
・バーコード等と比べ誤読率が高い
・読み取り速度が遅い
・読み取り可能なハンディターミナルが少ない

このような問題があることから、新しいシステムを開発する際にOCRを読み取りコードとして採用する事はありません。しかし、業界の慣習や上位システムのハードウェア移行問題もあって、OCRを読み取らなければならないという状況は今でも存在します。

 その代表的な業界が出版(書籍流通)業界です。現在出版される書籍や雑誌などには書籍2段コードや雑誌アドオンコードというバーコードが印刷されています。しかし、バーコードが印刷されていない古い書籍なども継続して販売されていること、および追加注文や返品時に使用する為のスリップ(書籍には必ず「しおり」のような短冊がはさんでありますね。これをスリップと言います)にOCR文字が使用されており、システム上で読み取られている事などの要因から、OCR文字は出版業界にとって払拭できないものなのです。

OCRを読み込めるハンディターミナルは現在のところ、住友電工システムソリューション(株)の「PM5000」と(株)デンソーウェーブの「BHT-300Q-O」の2機種しか販売されていません。 先の「PM5000]はかなり古い機種で、小学校のときに使っていた「ふでばこ」のような重く大きな筐体で、スキャナー部分が一体型でないなど使うのに一苦労しますが、OCRを読めるハンディターミナルが長い間この一機種だけだったので、現在でも書店や出版取次店などで多く使われています。書籍や雑誌に限らず、その他のOCRも読み取ることが出来ますが、印刷品質や読み取り口の当て方によっては誤読する場合もあるので少々注意が必要です。

後発の「BHT-300Q-O」は書籍のOCRであるISBNコード、雑誌のOCRであるTコードだけに限定し誤読率を極めて低下させています(私は誤読したところを見たことがありません)が、書籍や雑誌以外のOCRを読むことが出来ないので出版業界専用といえるでしょう。なお、書籍2段バーコードの一括読み取りや雑誌アドオンコード、加えてQRコードなどの2次元コードも読み取れます。

完全に業界に特化したマニアックな話になってきました。ついでに補足すると、海外との規格統一化も絡み2007年からはISBNコードのOCR文字は廃止されました。しかしOCRを読むことがなくなるかというとそうではありません。前述したようにバーコードが印刷されていない古い書籍などが書店に継続して置かれていたりするので、業界全体がそれらをシステム上切り捨てるという決断をするまでは、残り続けるでしょう。


トップへ戻る

記事一覧