ブログ

OCRの精度を上げて業務効率に役立てる方法

OCRの精度を上げて業務効率に役立てる方法

紙媒体が絡む業務の効率化として、OCR技術の活用方法が考えられます。しかし、認識精度に不安があり、OCRの導入に二の足を踏んでいるということも少なくないようです。ちょっとしたポイントを押さえることで、OCRの識字率を向上させることができます。今回は、OCRで読み取りにくい文字や識字率を上げる方法、OCRとAI、RPAを組み合わせた業務効率化について解説します。

OCRの基礎知識

まず、OCRとはどのような技術なのか、どのような仕組みで文字を認識するのかについて解説します。

OCRとは

OCRとは、Optical Character Recognition(光学的文字認識)の略称であり、画像の中から文字を見つけ出し、コンピューターが利用できるように文字データに変換する技術です。OCRは1914年に開発された歴史ある技術で、日本でも昔から金融機関や公共機関でよく利用されてきました。近年、RPAとOCRを組み合わせることで紙媒体を用いた業務の効率化が実現可能になったため、OCRがふたたび注目されています。

OCRの基本的な使い方は、

  1. 紙媒体をスキャンして画像データ化する

  2. 画像データをOCRで読み取り、CSVなどのテキストデータにする

という流れになります。

OCRが文字を認識する仕組み

OCRはスキャンされた文章を分解して文字を認識します。スキャンから文字認識までの流れは次のようになります。

  1. 文書をスキャンする

  2. レイアウト解析
    文書は、文字が書かれている領域の他にも、画像が使われている領域や罫線など、いくつかの段落で構成されています。文字認識を行うためには文書の中から文字が書かれている領域を見つけ出して、読む順番を決める必要があります。この処理をレイアウト解析と呼びます。

  3. 行の切り出し
    レイアウト解析で見つけた文字が書かれている領域を1行ずつ分解します。この処理は行の切り出しと呼ばれます。

  4. 文字の切り出し
    切り出した1行に注目して、さらに1文字ずつ切り出していきます。この処理は文字の切り出しと呼ばれます。文字の向きと交差する向きに線を移動させていき、文字と交差する数をカウントして文字と文字の区切りを判断します。交差する数が0になったところが文字と文字の区切りと判断されます。

  5. 文字認識
    最後に1文字ごとの認識を行います。文字の認識は、

    • 正規化:文字の大きさを一定に揃える処理
    • 特徴抽出:文字に使われる線を向きによって分解してその文字の特徴値とする処理
    • マッチング:あらかじめ登録してある文字の特徴値と抽出した文字の特徴値をマッチングさせて文字を特定させる処理
    • 知識処理:マッチングだけでは特定が難しい文字を、事前に登録してある単語辞書と照合して文字を特定させる処理


    というステップを経て行われます。

OCRでは認識しにくい文字がある

OCRの読み取り精度は、理論上100%になることはありえないといわれています。そして、以下のような文字は認識しにくいことで知られています。

  • カラー文字

  • かすれている文字

  • 網掛けされている文字
    OCRは「はっきり読み取れる黒い文字」を認識します。色付きの文字やかすれて読みにくい文字、網掛けで埋もれている文字は認識が困難です。

  • 原稿が斜めになっている

  • 縦書きと横書きが混在している
    OCRで文字を認識しやすいのは、「文字が一定方向にまっすぐ揃っている」文書です。文字が斜めになっていたり、縦書きと横書きが混在していると行の切り出しができず、文字を認識できません。

  • 文字の間隔が狭い
    文字の間隔が狭いと正確に1文字ずつ切り出すことが難しくなるため識字率が下がります。縮小された文書では文字の間隔が狭くなってしまうことがあるため、文字の識字率が低下する場合があります。

  • 機種依存文字
    「①」や「Ⅰ」などの機種依存文字はOCRソフトによっては認識できないこともあるので、極力使われていないことが望ましいです。

OCRの識字率を上げるテクニック

OCRで認識しにくい文字は、ちょっとした工夫をすることでOCRの識字率を格段に上げることができます。

  • 解像度を上げる
    高解像度でスキャンすることによってOCRが文字を認識しやすくなります。一般的には300dpi以上がよいとされていますが、あまりに高解像度にスキャンしてしまうと、スキャン作業やデータの読み取りに時間がかかりすぎて実用に耐えません。基本的には300dpiに設定すれば問題ありません。

  • 白黒でスキャンする
    OCRはカラー文字を認識しにくいため、スキャンは白黒で行います。

  • 原稿の向きをそろえる
    OCRは向きがまっすぐになっていないと文字を認識できません。スキャンする前に原稿の向きをきちんと揃えるというひと手間をかけるとよいでしょう。

  • コントラストを強調する
    網掛けなどで文字が埋もれてしまうとOCRが文字を認識できません。必要に応じてコントラストを強調すると文字がくっきりと認識できるので、読み取り精度がアップします。

OCRを効果的に業務改善に活用するために

OCRを業務に活用するときに注意したいポイントがあります。

OCRソフトには得意・不得意がある

OCRソフトは製品によって読み取り精度が変わります。また、読み取り言語にも違いがあり、海外のソフトでは日本語が読み取れないことがあります。逆に、国産のソフトでは外国語が読み取れないこともあります。その他にも、契約書のような文書や、請求書などの帳票の読み取りがそれぞれ得意なソフトもあります。読み取る文書の特徴に合わせて適切なソフトを選ぶ必要があります。

業務内容に合わせたフロー設計が必要

OCRを使う場合、人の目によるチェック・修正を入れるタイミングによって、業務フローが変わります。データを入力する業務の場合は、OCRで文字データを抽出した後に、人の目による全量チェックを入れてからデータを出力します。一方、売上管理のように紙のデータとデジタルデータを突合させるような業務の場合は、OCRで文字を抽出し、デジタルデータと突合してから最後に一致しなかったデータだけを人の目で確認すると効率的です。

このように、業務に合わせたOCRソフトの選定と、適切な全体設計によって、OCRを効果的に活用できます。

AI-OCRとRPAの組み合わせでコスト削減

従来のOCRでも、Wordなどで打ち込んだ定型の文書であれば十分な読み取り精度で活用することができます。しかし、手書きの帳票などに対しては読み取り精度が低く、業務への活用が現実的ではありませんでした。

そのような従来型のOCRの弱点を克服したものがAI-OCRです。AI-OCR は、OCR技術にAIを導入することで、手書き文字の認識精度を格段に向上させたものです。データ処理をしながら学習させたり、あらかじめトレーニングデータを用意して手書き文字を認識させることで認識精度を上げます。また、非定型のフォーマットにも自動で対応可能なAI-OCRソフトもあり、形式がバラバラな帳票を一度にテキストデータ化することも可能になります。

つまり、AI-OCRとRPAを組み合わせれば、今まで実現が難しかった手書きの文書が関わる業務の自動化ができるようになったということです。
例えば、以下のようなことも可能になりました。

  • 手書きの帳票をAI-OCRで読み取り、RPAで基幹システムに自動登録する
  • 手書きのアンケートをAI-OCRで読み取り、RPAで集計・分析を行う

NTT印刷ではまるごと電子化(プリドキュ)というサービスを提供しています。
まるごと電子化(プリドキュ)サービスは、紙媒体からの情報抽出~データ活用までをトータルでサポートするものです。きめ細かなコンサルティングによって、それぞれの業務に適した情報の活用や業務効率化を実現させるため、紙文書の保管や膨大な処理工数のお悩みを一度に解決することが可能です。

可能性が広がるOCR技術

AI-OCRの登場によって、従来のOCRでは難しかった手書き文字の認識精度が格段に向上し、OCR技術の可能性がさらに広がりました。IT化が進んでも、紙媒体が絡む業務はまだまだたくさんあります。人の手で処理する場合、膨大な工数がかかり、作業ミスも発生しやすくなりますが、AI-OCRとRPAを組み合わせたソリューションを利用することにより、業務を自動化・効率化することが可能です。紙媒体が絡む業務の効率化に、OCRやAI-OCRの活用をぜひ検討してみてはいかがでしょうか。

参考:

業務効率化・働き方改革のお役立ち資料

関連記事