NEWS
お知らせ
R&Dプロダクト「7セグOCR」のご案内
R&Dプロダクト「7セグOCR」のご案内
撮影した画像からデジタル表示を読み取る「7セグOCR」を提供いたします。
一般的なOCRの特徴
現在のOCRでは、背景を含む画像から段落を特定し単語などの前後関係も解釈しながらテキストに変換します。一方で、デジタル時計のような表示は、文字数そのものが少なく単語として存在しない羅列のため、Googleなどが提供する汎用的なOCRではテキスト化が難しい領域です。
以下の画像では、Googleが提供するOCRでは「SEIKO」や「スヌーズ」のような単語のみ抽出されます。
またデジタル表示のような、7つの棒で表現されるデジタル表示のことは、seven-segment display と呼ばれています。Seven Segment OCRというような単語で検索すると、オープンソースでOCRライブラリが提供されていますが、精度に関しては実用レベルではありません。7セグメントディスプレイの文字認識をするSSOCRを徹底検証
今回開発したOCRの特徴
seven-segment displayが含まれる画像は非常にシンプルなため一般的なOCRほど「段落」「前後関係」などの情報が足りずに解析に失敗します。そこで本プロダクトでは機械学習などを使わずに純粋に7つの棒を画像認識で位置特定する方法でOCR処理をします。seven-segment display のみに特化することで、英字や日本語の類似の文字と誤認識する心配もありません。
このように seven-segment display のみに特化したOCRを、7セグOCRとしてリリースいたします。
以下主要機能です。
背景削除機能
一般的なOCRは背景から文字の領域のみを取り出すところで失敗することが多いですが、7セグOCRでは背景からディスプレイのある領域を取り出すところに注力しております。
台形補正機能
背景からディスプレイ領域を特定する段階で、台形を補正いたします。
テキストサイズ出力機能
OCRの結果はJSON形式で出力します。その際に数値を特定した座標と数字の大きさを出力します。誤想定以上に小さな文字をノイズとして扱うことで誤認識を省く用途を想定しています。
領域指定機能
予めOCRすべき領域を指定することも可能です。多くの場合は定点カメラでの撮影となりますので、あらかじめ領域を指定することでOCRの精度を上げることが可能です。
開発の背景
温度計や湿度計など、デジタル表示される計器は多く存在しますが、IoT機器として通信はできてはいないため、人間が読み取って入力する手間が発生します。一方で本格的なIoTセンサーは機械に対するインターフェースのみであるため人間がその稼働状況を直接判断することができません。
計測機器が表示するUIを機械が読み取ることで人間も機械も読みりやすいデジタル化を実現したいというのが開発の背景となります。
弊社ではWebデータアグリゲーション事業で、ヒューマンリータブルなWebサービスをマシンリーダブルなビッグデータに変換する事業を展開し拡大しております。Webサービスだけではなくリアルな世界でもヒューマンリーダブルなインターフェースをマシンリーダブルなデータに変えることでビッグデータ化を容易にしたいというところから、7セグOCRを開発するに至りました。
今後も株式会社ルーターは偏在化する情報をリアルタイムにビッグデータに変換することで日本のDX化を推進いたします。
CONTACT
お問い合わせ・ご依頼はこちらから