LABORATORYラボラトリー

HOME > ラボラトリー > 文字認識(OCR)技術の検証

画像処理 OCR

文字認識(OCR)技術の検証

現在、株式会社オルトア様との協同研究において、文字認識(OCR※)の技術検証をしています。
世の中にはすでにOCRエンジンが多数出ています。画像処理だけで行うエンジンもあれば、AIを駆使して動作するエンジンもあります。いずれにせよ、OCRという要素技術では、文字の状態によって得意不得意があるようです。

※OCR:Optical Character ReaderまたはRecognition

今回は、あるOCRエンジンの検証をしました。テスト対象は2D図面の画像データです。
世の中にある様々なOCRエンジンにおいても、処理の難易度はほぼ同様になるのでは?と考えています。

  • フォントの違い
  • 傾斜付き文字
  • 下線付き文字
  • 枠線付き文字
  • 癖の強い手書き文字

上記のような文字の状態(条件)の違いによるOCRエンジンの検証結果の一部をご紹介します。

フォントの違いによる認識率の検証

条件

  • 検証対象の文字列は、実際に2D図面で使用されている下記の例文を使用しました。
  • 対象フォントは下記のWindows標準フォント5種類。
  • フォントの違いだけでなく、使用した文字列認識技術では「日本語のみ」、「日本語+英語(優先言語:日本語)」、「英語+日本語(優先言語:英語)」の設定が可能だったため、設定ごとの認識率も確認しました。

検証結果

検証結果は下記一覧のようになりました。
調査したWindows標準フォントにおいては、70%以上で大きな差はないものの、BIZ UD明朝の「日本語のみ」と「日本語+英語」の設定が一番認識率の高い結果になりました。

BIZ UD明朝の文字列:誤認識の例
 記号: /(スラッシュ)、±(プラスマイナス)、□(四角枠)、▼(黒下向き三角)、+(プラス)を誤認識
 文字:カタカナの「バ」を「パ」に誤認識など。

傾斜付き文字、下線付き文字、枠線付き文字の位置特定技術についての認識率の検証

条件

  • 文字列の15°ピッチで傾けた13パターンで検証
  • 「寸法値のみ」、「寸法に枠線、下線あり」で検証
  • 対象フォントは、フォント違いの検証で使用したWindows標準フォント5種類。

検証結果

抽出レベルを4段階①~④で評価しました。
「レベル①:寸法値全体を1つの文字列として認識」できることがベストですが、「レベル②:寸法値全体を複数の文字列として認識」ができれば、後処理で文字の結合は可能になります。
調査したWindows標準フォントでは①、②を合わせると100%の認識率になりました。
枠線、下線があるほうが①の認識率が高くなるフォントなど、大変興味深い結果になりました。

数値の桁数と下線有無、癖の強い文字に対する認識率の検証

条件

  • 整数値、小数点以下の桁数を変えたテストデータ8種類
  • Windows標準フォント「MSゴシック」、癖の強いフォント例として、フリーフォント「GN曲線ストロークフォント」、「櫻井幸一フェルトペンフォント」で検証
  • 文字サイズ3種類、「小」、「中」、「大」
  • 数値に下線有無
  • 「日本語+英語」、「英語のみ」の条件設定

検証結果

MSゴシックの下線無しでは文字サイズの影響は少なく、整数1文字だけの認識ができていません。
下線付きの場合は認識率が大幅に低下する結果に、また、癖の強いフォントでは条件の違い以前に、認識ができない結果になりました。

今回のOCRエンジン検証は、上記のような結果となりました。
手書き文字の検証については、検証結果が整理できたところで、このラボラトリーに追加掲載します。

OCRエンジンは今後も進化し続けていくでしょう。アルモニコスも引き続きOCRエンジンの進化に伴った検証を進めていきたいと思います。

研究担当

文字認識(OCR)技術の検証

株式会社オルトア 須藤 享明 氏

2001年に株式会社オルトアへ入社。

同2001年より、アルモニコスの開発プロジェクトに参画。長期間にわたり、パッケージソフトspGaugeの開発に参加した後、spScan、ClassNK-PEERLESSの開発に参加。アルモニコスのほぼすべてのパッケージ開発に参加している古株的存在。

趣味は、食べることとウォーキング。

※プロフィール画像は奥様が描かれた似顔絵。

文字認識(OCR)技術の検証

AXION事業部 プロジェクトスーパーバイザー 山根 雅則

元国鉄職員という異色の経歴。国鉄退社後、自動車プレスの業界でプレス成形の業務(金型検査、成形シミュレーション、非接触測定機導入推進、ハイテン材成形研究、ホットプレス技術開発)に従事。

アルモニコスの製品検査ソフト「spGauge」のヘビーユーザーかつ、リバースソフト「spScan」のファーストユーザーでもあり、新バージョンの仕様提案をしてきた。

ソフトウェアのユーザーから作り手になりたいと、アルモニコスに2014年入社。

入社して以来、spScanの営業担当マネージャーとして、仕様決めから営業、販売、講演まで幅広く担当。

趣味は、プラモデル、シーカヤック、自動車、競技自転車など多岐にわたる。シーカヤックはインストラクターの経験あり。

定年退職後に自作でログハウスを作るという夢を持ち続け、枕木300本を20年前に購入済み。

文字認識(OCR)技術の検証

株式会社アルモニコス 代表取締役社長 森川滋己

1988年、(株)アルモニコス入社。

入社以来、「点群、ポリゴン、自由曲線、自由曲面」を扱う形状処理技術に従事。特許出願、多数。アルモニコス製パッケージソフトspGate、spGauge、spScan、ClassNK-PEERLESSの企画および立ち上げを牽引。

1999年、取締役に就任。2014年、代表取締役社長に就任。

趣味は、読書、釣り、ゴルフ、サーフィン。

文字認識(OCR)技術の検証

※所属・肩書は記事掲載時のものであり、現在とは異なる場合があります。