ブログ

AI-OCRってなに?最新のOCR技術でさらなる業務効率アップ!

AI-OCRってなに?最新のOCR技術でさらなる業務効率アップ!

画像として取り込んだ文字を認識し、テキストデータに変換するOCR(Optical Character Recognition:光学文字認識)。手作業での文字入力を削減できることから、書類や帳票を業務システムに入力する場面で広く活用されてきました。しかし、活字の読み取り精度は向上しても、手書き文字の認識は難しく、実務での幅広い活用は難しいという状況が長く続いてきました。それが、近年話題となっているAI(人工知能)技術との融合によって、OCRの活用は大きな進歩をとげつつあります。ここでは最新のAI-OCR技術について事例も交えて解説します。


<CONTENTS>

 新たなOCR。AI-OCRの3つのメリット

 OCRの文字認識率は100%ではない。ではどうするのか?

 OCR活用で業務効率化! 稼働時間9割減も

 まとめ


 

新たなOCR。AI-OCRの3つのメリット

従来のOCRと区別し、「AI-OCR」と呼ばれている技術があります。従来のOCRとの大きな違いは、ディープラーニング(深層学習)技術によって認識すべき文字を学習できるようになり、読み取りの精度が大きく向上した点です。

  • 文字認識率が高い

従来のOCRでは、1文字1文字の認識率を高めるために、帳票内の決められたフォーマットへの文字記入が必須となっていました。一方、AI-OCRは、自由記述欄のような文字の位置がおおまかな文書でも読み取ることができます。また、文字を間違って認識したとしてもAIに誤りを学習させることで、正しい文字として認識できるようになるため、文字認識率が高まりました。

  • フォーマットが異なる帳票も対応可能に

帳票をOCRで読み取る際は、事前の帳票設計が必須でした。それが、AI-OCRでは文字の位置はおおまかに指定されていれば、契約書や発注書、請求書など、さまざまなフォーマットの帳票でも読み取れるタイプも登場しています。

OCRの精度を向上させるには、実装したい業務の帳票を分析し、定型帳票、準定型帳票、非定型帳票といったパターンごとにアプローチをしていくことによって、分析・検証・チューニングを繰り返していきます。こうして設計レスでの対応が可能となり、OCR業務の実装工程を大幅に短縮することが可能です。

  • RPAとの連携でさらに作業効率が向上

AI-OCR は、PCによる作業を自動化するRPA(Robotic Process Automation)との連携により、さらなる作業効率向上の実現が可能です。RPAを活用すれば、帳票に記載されている情報をAI-OCRが抽出し、業務目的に合わせて、データ入力、集計・加工、出力といった一連の作業を自動化できます。これらの作業を夜間にRPAで実行しておき、業務時間中に人が確認するようにすれば業務効率が大幅に向上します。

OCRの文字認識率は100%ではない。ではどうするのか?

AIまで搭載されるようになったOCRですが、残念ながら文字の認識率は決して100%にはなりません。AIによる学習がもっと進めば識字率自体を今よりもさらに高めることは可能ですが、現状では読み取りミスも発生します。ここでは、OCRの読み取り精度を高めるための工夫についてお伝えします。

  • OCRの精度を高めるためのアプローチ

OCRの読み取り精度は、“場所特定率”という文字を読み取る場所を特定する精度と、“文字認識率”というOCRエンジンが記載情報をデータに変換する精度の2要素が重要です。

OCRの読み取り精度を高めるには、実際に業務で用いる帳票を使って分析し、読み取り位置と文字認識をチューニングしていく必要があります。NTT印刷では、OCR精度を高めるための「帳票コンサルティングソリューション」のサービスを提供しています。

  • 帳票のレイアウトや枠線、データを読み込むスキャナも、精度に影響を与えるポイント

OCRでの電子化を目指す書類には、契約書や発注書、請求書など企業ごとに帳票フォーマットが異なっているものや、FAXやはがきといった手書き文字のデータ入力といった非定型のものも存在するでしょう。いくらAI-OCRといえども、その精度は下がってしまいます。

AI-OCRに限らず、OCR全体に言えることですが、帳票のレイアウトや枠線(線種、太さ、色、大きさ)を見直すだけでも、読み取りの精度を上げることができます。
さらに、OCRでデータを読み込むためのスキャナ自体の設定もOCRの精度に大きく影響します。読み取る帳票にあった解像度や色設定を調整することによって、精度を高めることができます。 

  • ソフトウエア自体の精度

NTT印刷で採用しているAI-OCRは、特に手書き文字の認識率が高くなっています。
一般的に、AI-OCRの手書き文字認識率は95%程度が多いなか、調査会社のMM総研が2019年6月に実施したトライアルテストにおいて、当社で採用しているAI-OCRは、96.4%を実現しました。

一般的なOCRの場合、文字を「形」としてしか認識できず、手書き文字特有の癖などから正しい判断をすることができません。しかし、AI-OCRではAIが手書き文字の癖を学習し、文字を認識することが可能です。

hikaku.png

  • AI-OCRの活用事例

アンケートはがきの結果集計や過去研究資料冊子のデータ化、診療報酬明細書(レセプト)のデータ化、雇用保険届のデータ化など、AI-OCRは幅広い業務に活用されています。

AI-OCRは、癖のある手書き文字の読み取り精度が高いほか、「〇」で囲われたものの検出、取り消し線の判読など、通常OCRの機能だけではできないものが実施できるため、データを全件手入力する場合と比較し、作業者への負担は大きく軽減されました。人の手が介在するのはAI-OCRがデータ化した内容の目視検査が主となり、現場スタッフの作業効率も上がったとの評価をいただいております。

  • OCR精度向上でデータ確認の手間が減少

従来のOCRでは、OCRが読み取りした結果を人が全件確認することがほとんどでした。読み取れていないデータのまま、後の処理に流してもエラーになってしまうからです。ただ、全件確認作業も人が行うためにミスが多く発生してしまうのも事実でした。OCRによって1文字1文字を手作業で入力する手間は削減できたものの、確認作業を実施する人の作業量を減らし、正確性を向上させるのが困難でした。
しかし、AI-OCRの活用で文字認識率が高くなったことで、人が逐一データを確認する必要性は減り、データ化されている前提で先の業務に進められるようになりました。データ化された次の作業段階で、他システムからのデータとの突合時にエラーが発生した場合のみ確認するという業務フローにしておけば、作業時間を大幅に削減できます。

ただ、繰り返しになりますが、AI-OCRでも読み取り精度は100%ではありません。そのことを前提に、業務全体での効率を考えたプロセスの見直しが必要です。

OCR活用で業務効率化! 稼働時間9割減も

ここではNTT東日本と目黒区とのAI-OCR・RPA活用実証実験の事例を紹介します。

目黒区では2019年の5~6月に、保育課の「保育施設運営費支出」および、人事課の「研修評価シート集計」の2業務を対象とし、どちらもAI-OCRで紙の書類をデータ化したうえでRPAを活用し、エクセルへの入力作業を自動化しました。

保育施設運営費支出業務では、年間での稼働削減率は9割に達する見込みです。AI-OCRの読み取り精度については99.9%と個別チェックが必要ないほどの精度を実現しています。

一方、職員研修を実施後の手書き研修評価シートの集計業務も年間での稼働削減率が3割を超える見込みとなりました。こちらは、手書き文字も含めたAI-OCR の読み取り精度は98.2%となり、自由記述欄の転記も自動化できるようになりました。

AI-OCRとRPAはこのほか、長野市、東京都三鷹市、千葉市などでも各種申請書や届出書、請求書といった書類をシステム上に入力する場面での自動化に貢献しています。

紙の書類が多く正確性が求められる自治体でも、AI-OCRとRPAはこれだけの成果を出すことができました。今までは導入が困難と考えられていた業務や手書き入力帳票が必須の業務でも、AI-OCRの活用によって業務効率を大幅に向上することができます。

まとめ

OCRという技術は古くから研究され利用されてきたものの、技術の限界によって特定業務の一部分の効率化に限定されているイメージが強いのではないでしょうか。それが、最新のAI技術との融合によって、手書き文字の認識率が向上し、従来では困難とされていた業務でも活躍できるようになりました。
さらに、AI-OCR とRPAを組み合わせることによって、読み取ったデータを自動で必要な業務に連携することまで容易に実現できるようになっています。これらの技術を活用し、さらなる業務の効率化を検討されてはいかがでしょうか。

 

参考:

 

業務効率化・働き方改革のお役立ち資料

関連記事