ブログ

AI-OCRの登場で、手書き帳票のテキストデータ化を実現!

AI-OCRの登場で、手書き帳票のテキストデータ化を実現!

新型コロナの影響から、一気にリモートワークを推進する企業が増え、従業員は会社のオフィスだけでなくリモート環境から業務を実施できるようになりました。これは社内業務のシステム化が進んでいたことも一因と考えられます。しかし、企業間の取引においては、まだまだ手書きの帳票、伝票や申込書などが多く残っているという企業も多いのではないでしょうか。こうした手書き帳票類をテキストデータ化すれば便利なものの、従来型のOCRでは、手書き文字などで一部読み取れない、正しくテキスト変換ができない部分が発生していました。そうしたテキストデータ化ができていない対象の確認と、人手による修正が大きな手間となり、OCRサービスの導入を取りやめたという方もいるかもしれません。ここでは、そうした方向けに最新のAI(人工知能)技術とOCRを組み合わせた「AI-OCR」を活用した手書き帳票のテキストデータ化をご紹介します。また、活用にあたっての注意点もあわせて考察します。

手書き帳票を利用する業務

手書き帳票といってもさまざまな種類があります。ここでは手書き帳票の一例を業界別に挙げてみます。

銀行・証券:口座振替依頼書、口座開設申込書、振り込み依頼書、ローン申込書

保険:保険申込書、入院手術証明書、診断書、保険金請求書

公的機関:各種申請書、口座振替依頼書

医療機関:問診票、問診票、健康診断票、介護記録や臨床検査記録、処方せん

不動産:契約書(自署サイン)、申込書、口座振替依頼書、管理帳票

その他:アンケート用紙、保守点検記録、発注書、在庫管理表、業務報告書、売上伝票、営業日報


企業におけるシステム化が進み、バックオフィスのペーパーレス化に取り組みはじめている企業も増えています。しかし、いまだに発注書や申込書など、企業間の取引において、紙による手書き帳票を取り扱うことも多いものです。インターネットの発展により、紙の帳票を利用せずスマートフォンやPCの画面に直接入力できる「電子帳票」も登場しましたが、従来の業務を考えると完全に紙書類をなくすことは難しい状況です。紙の帳票がなくならないことで、記入されている内容を手作業でコンピュータへ入力しなければならず、その作業量に頭を悩まされている方も多いのではないでしょうか。

MM総研による「国内法人のAI-OCR導入実態調査(2019年6月実施)」によれば、回答者の51.5%が最も非効率な業務として「データ入力・登録」を挙げており、紙の帳票やPDFデータから文字を識別してテキストデータ化をする業務は、非効率なだけでなく、具体的な解決策にも乏しいと考えられているとの結果も出ています。

手書き帳票をテキストデータ化する方法

手書き帳票をテキストデータ化するには、主に以下の方法があります。

  • AI−OCRを利用する

PCと接続したスキャナやデジタルカメラを使って読み取った画像の文字情報をOCR対応のアプリケーションソフトを利用して取り込み、テキストデータに変換します。従来のOCRが苦手としてきた手書きの文字に関しても、近年では、AIによる学習機能(ディープラーニング)をもたせ、手書き文字のもつ「癖」をAIが覚えることによって、識字率がかなり向上しました。

ただし、読み込みはスキャナやデジタルカメラを使っての手作業となるため、社内で大量のデータを処理するには、それなりの体制と設備が必要となります。 

  • データ入力代行サービスを利用する

BPO(ビジネス・プロセス・アウトソーシング)の一環で、データ入力を代行する企業に作業発注する方法です。専門性の高い企業に頼る方が、効率的かつ効果的なテキストデータ化が期待できます。ただ、外部に作業を委託するには、費用対効果やセキュリティへの信頼性(機密性の高い書類の場合)などを考慮する必要があります。

NTT印刷「まるごと電子化(AI-OCR)」のサンプルケースの紹介

「AI-OCR」を活用したアンケートはがきの読取および集計・分析の実施

あるお客様から「ある商品に同梱しているアンケートはがきがあるのですが、クライアントから返送されても、1枚1枚読む時間がなかなか確保できず、保管しているだけで利活用できずに非常にもったいないと考えております。せっかくのクライアントの声を効率よく利活用する方法はありませんか?」という相談をいただきました。
クライアントからの商品への感想は、アンケートの選択肢から選ぶものもありましたが、コメント欄への手書きによる自由コメントが中心となっていました。こういう内容こそAI-OCRにて即座にテキストデータ化をすることができ、集計して分析することによって、クライアントが商品に対してどのような思いをもたれているのかを把握することができます。それらのご要望を次なる商品や別の商品開発に反映することによって、お客様の満足度アップにも貢献にすることができました。

手書き帳票のテキストデータ化に関する考慮点

手書き帳票のテキストデータ化については、対象となる帳票が過去に作成・蓄積されたものだけなのか、現在も日常業務で日々作成されているものかによって、電子化に向けた業務フローも異なってきます。

蓄積されたものなら一度だけテキストデータ化し保管書類と差し替えれば完結しますが、現在進行形で作成している書類であれば、日常の業務フローにテキストデータ化の手順を組み込む必要があります。データ量が膨大であれば、前述したようにBPOを活用する業務フローに変更する必要があるでしょう。

AI-OCRの活用で手書き帳票のテキストデータ化が進んでも、企業関係の電子データの取り扱いを定めた「電子帳簿保存法」や「e-文書法」に該当する書類のデータ化に関しては、法に従う必要があることを考慮しなくてはいけません。ここでは特に、経理関係の書類の取り扱いに関連する電子帳簿保存法について見ていきましょう。

「電子帳簿保存法」における帳票類を電子保存する際の注意点

電子帳簿保存法は、帳簿や決算関連書類など国税帳簿書類の電子データ化を認めた法律です。主に、データ作成から保存までを一貫してパソコン上で行う「電磁的記録(電子データ)による保存」と紙媒体で作成した書類をスキャナやカメラで電子化する「電子化保存」の2点を定めています。ここでは、手書きの書類をスキャナで読み込んで電子データで保存する際の注意点について説明します。

最も注意すべきなのは、電子帳簿保存法では会社関連の書類のうち、電子化保存を認めていない書類が存在するという点です。同法で保存を認めていないのは以下の書類です。

  • 国税関係の帳簿:手書き作成した仕訳帳や総勘定元帳、その他の補助簿
  • 決算関連書類:手書き作成した損益計算書、貸借対照表、棚卸表

このほかの契約書や領収書、請求書、納品書といった重要書類のほか、見積書、注文書、検収書といった一般書類は、電子化保存が認められています。ただし、所管の税務署への事前申請手続きが必要です。

また、スキャナで読み取って書類を電子保存するには、以下の要件が課されています。

  • 入力期間の制限:重要書類については、書類の作成・受領から速やか(おおむね7営業日以内)に入力すること
  • スキャナの精度:解像度が200dpi以上、赤・緑・青の階調が256階調以上(一般書類はグレースケールも可)
  • タイムスタンプの付与:書類の受領・読み取り後、速やかにタイムスタンプを付与する(おおむね3営業日以内)
  • 読み取り情報、入力者の管理:読み取った際の解像度や書類の大きさ、入力者を記録する
  • バージョン管理:訂正または削除を行った場合には、これらの事実および内容を確認できるようにしておく
  • 相互関連性の確保:記録データ同士の関連性を確認できること
  • 関係書類等の備え付け:電子保存するシステムの概要書、仕様書、操作説明書、事務処理マニュアルなどを備え付けること
  • 見読性の確保:保存した電子データをディスプレイで確認でき、速やかに出力できること
  • 検索機能の確保:電子データの検索が取引年月日、勘定科目、取引金額などを指定して検索できること

電子帳簿保存法はこれまでたびたび改正が行われており、2020年10月にもペーパーレス化のさらなる普及、推進を主眼とした改正が行われました。手書き帳票のデータ化を検討されている場合は、関連法律についてもチェックしましょう。

まとめ

少し前までは、かなり難しいとされていた手書き帳票のテキストデータ化に関しても、現在の技術を駆使すれば十分に実現が可能なレベルにまで進化を遂げました。現行業務への適用を検討されてはいかがでしょうか。

参考URL:

業務効率化・働き方改革のお役立ち資料

関連記事