データクレンジング・OCR | AI OCR


OCRとは?

OCRとは、Optical Character Recognition/Readerの略で、光学的文字認識と訳されます。
光学的文字認識とは、一言で言うと「画像や手書き文字、印刷された文字をテキストデータに変換する技術」のことです。スキャナやWEBシステムを使って、対象文字を読み取る(=OCR)ことで、様々な業務を大幅に効率化することが可能になりました。RPA※やAIなどのテクノロジーによる業務効率化がグローバルに進んでいる中、日本では契約書や請求書など紙での事務処理が多く発生しています。OCRを利用することにより、そういった紙処理からの脱却による業務効率化が期待されています。近年では、OCR技術が進化し「AI OCR」と呼ばれるAI搭載型のOCRシステムの導入も進んでおり、DX化が進んでいます。

※RPA:Robotic Process Automationの略で、単純な定型作業を自動化する技術

※読取イメージ
※画面イメージ
OCRとは?

OCRの導入効果は?

OCRの導入効果として、主に以下の3つが挙げられます。

1.入力作業の負荷削減

入力作業の負荷削減

2.保管スペースの削減

保管スペースの削減

3.検索性の向上

検索性の向上
入力作業の負荷削減

1.入力作業の負荷削減

紙データの入力作業を手作業で行う場合、細かい作業が多いため、入力ミスや入力漏れなどのヒューマンエラーが高い確率で発生します。そのため、入力結果の一次確認や、企業によっては二次確認が必要でした。しかし、OCRを導入することで、スキャンと同時に読取データを作成できるため、集中力が必要な細かい作業は発生しません。そのため、データ入力負荷や確認工数を大幅に削減することが可能になり、本来”人がするべき(機械任せにはできない)業務”に注力できるようになります。

保管スペースの削減

2.保管スペースの削減

紙処理での対応の場合、管理する書類が増えるにつれ、物理的な保管スペースが必要になります。棚いっぱいの請求書冊子や、ダンボールに箱詰めされた取引書類などの中から、必要な請求書だけをピックアップするためには、専任の管理者まで必要となってしまいます。OCR処理されたテキストデータであれば、サーバー上にデータとして保管されるため物理的なスペースは一切必要ありません。また。テキストデータは画像データに比べて700分の1ほどの容量なため、サーバー上の保管スペースも削減することができます。

検索性の向上

3.検索性の向上

従来は、紙の書類をスキャナにかけ、画像データとして社内サーバー上に保存しておくことは可能でしたが、必要な書類を検索しようとしたとき、ファイル名を元に検索するしかありませんでした。しかし、書類をOCRによって、テキストデータ形式で保存することで、必要な書類をファイル名だけでなく、書類内のキーワードでも検索することが可能になりました。また、テキストデータ形式で保存することで、データレイク※やデータウェアハウス※への連携が容易になり、素早いデータへのアクセス、分析が可能なため、企業のDXが推進されます。

※データレイク   :多数のデータを元のままの形式で大量に保存できるストレージシステム
※データウェアハウス:多数のデータを統合し、時系列で整理した管理システム

ここまでで、OCRについてお伝えいたしました。ここからは、近年導入が盛んに進んでいる「AI OCR」についてご説明いたします。

AI OCRとは?

AI-OCRとは、その名の通り、OCRエンジンにAIが搭載されたソリューションです。AIが搭載されることにより、従来のOCRでは難しかった細かな設定の自動化が可能になりました。

AI OCRとOCRの違い

昨今導入が急速に進んでいるOCRとAI OCRでは具体的に何が違うのか、以下にてご説明いたします。 通常のOCRですと、人が手を加えて読取対象帳票の登録や文字の読取精度の改善を行う必要がありましたが、AI OCRでは、ディープラーニング※により、そういった人による業務を自動化することができるようになります。

※ディープラーニング:大量のデータをAIにインプットし、課題の解決方法を学習させること

OCRの特徴

OCRの特徴

システム化

OCRの特徴:システム化
  • ・読取文字のテキストデータ化
  •  
  •  

人による対応

OCRの特徴:人による対応
  • 全ての帳票に対して
  • ・文字読取処理の修正による読取精度改善
  • ・帳票内の読取箇所をシステム登録
flow
AI OCRの特徴

AI OCRの特徴

システム化

AI OCRの特徴:システム化
  • ・読取文字のテキストデータ化
  • ・AIによる文字読取精度の向上
  • ・AIによる読取箇所や項目の自動抽出

人による対応

AI OCRの特徴:人による対応
  • AIで対応不可の帳票のみに対して
  • ・文字読取処理の修正による精度改善
  • ・帳票内の読取箇所をシステム登録

1.文字の読取精度の継続的な向上

従来のOCRでは、システムによるパターン処理で読取項目の抽出を行っております。帳票毎に、予め決められたパターンの枠内で処理を行うため、運用の中で出てきた課題に対しては、その都度人間が確認をして、新たなパターンを追加することで精度の改善を図る必要がありました。しかし、AI OCRでは、ディープラーニングを活用することにより、課題をAIが自動で分析し、同じミスを起こさないように徐々に改善を図ることができます。そのため、人の手をかけずに、継続的に文字認識率を向上させることが可能です。    

※アルゴリズム処理:問題解決のためのロジックや計算手順

2.フォーマットが異なる帳票にも対応が可能

これまでは帳票をOCRで読み取る際に、フォーマットが異なる帳票毎に、読取位置などの詳細な設定を人の手で行う必要がありました。しかしAI OCRでは、あらかじめ読み取りたい項目をシステムにインプットしておくだけで、AIが自動的に帳票内から読取位置や項目を自動で判断し、必要情報を抽出してきてくれます。弊社のAI OCRでは、本人確認書類や請求書、保険証券などをスキャンするだけで、必要な項目を自動抽出することが可能なため、業務負荷の大幅削減を実現することが可能です。

各企業様における業務効率化への取組

「AI、機械学習、ビッグデータ、RPA」などのDX推進が叫ばれる近年において、一般的なOCR、AI OCRとはなにか、またOCRシステム導入によりどんなことが解決できるのかをお伝えしました。既にOCRを導入している、またはオフショアやニアショア、非正規スタッフなどを活用して業務効率化に取り組まれている企業様は、以前に比べ格段に増えました。しかし、「オフショアにおける人件費の高騰」や「品質に改善余地のあるOCRシステム」が多く存在し、なかなか本当の意味での「業務効率化」が果たせていないのが日本の現状です。

具体的な業務効率化への取組例

中国等オフショア活用 国内ニアショア活用
非正規スタッフ活用 OCR活用

一般的なOCR|AI OCRの課題

前述した通り、一般的なOCRシステムの中には改善余地のあるものがほとんどで、大きく以下3つの課題がございます。

品質課題

サービス紹介で謳っているような「高精度」が
実現出来ていない

品質課題

技術課題

企業によってフォーマットのバラつきがある
非定型書類の読取ができていない

技術課題

コスト課題

OCRソリューションによっては、オフショアの
人力費用より高額になっている

コスト課題

ダブルスタンダードでは、独自技術を用いて上記の課題を解決しており、
廉価で品質の高いOCRソリューションをご提供しております。

ダブルスタンダードのOCR処理技術基盤

verified_user データクレンジングの技術基盤(データ収集・データ抽出・データ加工)が完成し、デジタルデータ・アナログデータ問わず汎用性が高く展開できている点にあります。

弊社のOCR処理基盤ではAIを活用しているため、継続的な文字認識率の向上が可能かつ非定型書類への対応も可能です。また、弊社独自の取組として、読み取った文字情報をそのままテキストデータにするのではなく、”データクレンジング処理※”を行ったうえでテキストデータに変換しております。また、OCRエンジンは明暗や大小、光の反射などのデータスキャン環境によって読取精度が大きくぶれる可能性があるため、弊社では複数のOCRエンジンを使用し、環境に依存しない技術基盤を完成させているため、圧倒的な文字認識率を実現しております。

※データクレンジング処理:データに含まれるゴミや欠損情報などのデータ汚れを取り除き、キレイなデータに書き換える処理

データクレンジング技術

ビッグデータ処理で
培った
データクレンジング技術

最適なOCRエンジンの組み合わせ

最適なOCRエンジンの
組み合わせ

arrow_drop_down

圧倒的な文字認識率を
実現!

ダブルスタンダードのOCR製品ラインナップ

弊社ではデータクレンジング技術基盤を活用したOCR処理を活用することで、多くのソリューションを提供しております。

OCR導入事例

データクレンジング・OCR | AI OCRを活用した導入事例についてご紹介いたします。

OCRによる本人確認書類データ化

OCRによる本人確認書類データ化

「業務費用」+「時間短縮」実現をサポート

「業務費用」+「時間短縮」実現をサポート

金融業界におけるOCRソリューション事例

対象証券会社、銀行、カード会社、保険会社、FX会社など

verified_user WEB「口座開設」サポートシステム(eKYCシステム)の導入でバックオフィスの業務負荷を大幅削減

口座開設などの提出書類から、AIを活用したOCRシステムが高精度に文字を読取り、口座開設に伴うバックオフィスの業務負荷を大幅に削減します。
※OCRソリューションだけではなく、管理画面やユーザー向けの申込用画面も含めたパッケージも提供しています。

導入実績

チェック要員工数の削減
証券会社М様:65%削減見込み
証券会社S様:75%削減見込み

OCRによる本人確認書類データ化

OCRによる本人確認書類データ化

申込情報をデータ管理しペーパーレスの実現

申込情報をデータ管理しペーパーレスの実現

不動産業界におけるOCRソリューション事例

対象不動産会社

verified_user WEB「入居申込」システムでの入居申込のペーパーレス化

入居申込み時の身分証明書から、AIを活用したOCRシステムが高精度に文字を読取り、申込情報の入力負荷を削減します。
※OCRにより読取ったテキスト情報を入力フォームへ自動反映し、ユーザーの入力負荷の軽減・入力間違いが軽減されます。
※「不動産仲介会社」⇔「不動産管理会社」間での申込情報のやり取りがペーパーレスとなり、紙の管理コストがゼロになります。

様々な請求書に対し、高い精度で情報を抽出

様々な請求書に対し、高い精度で情報を抽出

他社会計システム用データの生成が可能

他社会計システム用データの生成が可能

大手企業様におけるOCRソリューション事例

対象大手企業様

verified_user 帳票処理エンジンを導入し、毎月発生する請求書のデータ登録作業を自動化

月間数千枚到着する様々な請求書をシステムにより自動的にテキスト化することで、大手企業の経理業務の効率化・社内要員削減を支援します。

よくある質問

サービス関連

  • OCRを導入するメリットを教えてください。

    OCRを導入することにより以下のメリットがあります。

    • 1.入力作業の負荷削減
    • 2.検索性の向上
    • 3.保管スペースの削減

    詳しくはサービスページをご覧ください。

  • OCR導入にあたり用意しておくことはありますか?

    貴社が普段の業務で使用されている書類の画像データをご提供いただくことで、PoCをさせていただくことが可能です。
    PoCでは、ご提供いただいた書類をOCRした場合、どれだけの読取精度が担保できるか検証することができます。
    サービスの詳細はサービスページをご覧くださいませ。

  • AI OCRは可能でしょうか。

    可能です。
    AI OCRだけでなく貴社専任のオペレータもご用意させていただくことで
    抜け漏れのないOCRサービスをご提供させていただきます。

  • OCRによる書類の読取精度を教えてください。

    正しい書類をアップロードいただくことで、ほぼ100%の精度で読取が可能です。

その他

  • 複数人で管理画面を同時に操作することは可能ですか。

    可能です。同時操作可能人数を絞る排他制御を行うことも可能です。

無料相談・資料請求

OCRについてのお問い合わせは下記よりお願いいたします。
※法人様の営業、ご連絡は「こちら」までお願いします

氏名

会社名

電話番号

※日中に連絡可能な電話番号(携帯電話可)を
入力してください。

メールアドレス

お問い合わせの種類

※プルダウンからご選択ください

お問い合わせ内容

サービス紹介

帳票処理エンジン

insert_drive_file

毎月の請求書業務の作業時間と人件費を大幅削減

アクセスブロック

block

Webサイトに訪れる不要アクセスをブロック

eKYC(本人確認)

people

当社技術を活用したeKYC(オンライン本人確認)サービス

arrow_upward