MENU

 

TOPICS

2024.01.25

ソリューション

詳細情報は随時更新・生成AIとAI-OCRを組合せたデータ化サービス
「AI Textract(仮称)」を2024年6月から提供

生成AIとAI-OCRを組合せたデータ化サービス「AI Textract(仮称)」を開発
~AI-OCRの技術的課題を解決し、2024年6月からサービス提供予定~



さくら情報システム株式会社は、2024年6月に生成AIとAI-OCRを組合せた新たなデータ化サービス「AI Textract(仮称)」の提供開始を予定しております。
「AI Textract(仮称)」は、従来のAI-OCRで必要とされている利用時の事前設定や調整を不要とし、さらなる業務効率化を可能にするサービスです。

GPT(生成AI)は膨大なテキストデータを事前学習することで、さまざまな文書と固有の用語に関する基礎知識を有しています。このことから、羅列されたテキストを適切な箇所で区切り、必要な情報を抽出する精度が一般的なAI-OCR製品より高い傾向があります。
さくら情報システムはこの特徴に着目し、全文OCR結果から必要な情報を抽出するサービスを開始するに至りました。

【従来のAI-OCRの結果データと、AI Textractの結果データの比較】
例)請求書の振込先情報において項目が1行で記載されている場合(口座名義人の区切りがはっきりしない)

gai_aiocr_infomation.png

一般的なAI-OCR製品の場合、適切な区切りが判断できないため適切な読み取り結果を得られないが、GPT(生成AI)を活用した場合、正確に必要な情報が抽出可能になった。

gai_aiocr_sample.png

■サービス提供の背景
比較的フォーマットが決まっている請求書や領収書などの帳票の読み取り技術は確立しつつあります。その一方で、フリーフォーマットの帳票、例えばアンケートや報告書など非定型のものはイメージを読み込む前にあらかじめフォーマットを利用者側で設定する必要があります。
そこで当社はそれらの課題に着目し、急速に進化するGPT(生成AI)を活用して読み取り設定不要で利用できる当サービスを開発しました。

■提供サービスについて
<特長>
さくら情報システムの「AI Textract(仮称)」は、Azure Open AI Serviceを利用して、さまざまな非定型帳票から必要な情報を自動的に抽出します。当サービスでは各帳票に対応した適切なプロンプトを提供するため、従来のOCR利用時の帳票パターンの学習は不要です。(特許出願中)
当サービスでは帳票に書かれた文字データをGPT(生成AI)が自動認識できるよう当社でプロンプトの指定を行いますが、このプロンプトが重要なカギを握っています。
プロンプトとは、AIとの対話形式のシステムにおいて用いられるユーザが入力する指示のことですが、AIがユーザの要求や問いに対して適切な応答や結果を生成するためには、明確で具体的なプロンプトが必要です。当社ではそれらの結果精度を高めるため、多種多様な帳票を使い日々検証を行っております。
なお、今まで同様、活字だけでなく手書き文字の帳票もデータ化が可能です。
当サービスでは業務内容や帳票の種類を問わずさまざまな帳票のデータ化が可能ですが、特に特殊な帳票や会社独自の帳票から情報を抽出したい利用者に向けたサービスとなっています。

gai_aiocr_azure.png

■利用形態
1、Web画面方式
Web画面のメニューから帳票タイプを選択し、PDFをアップロードするとCSVデータがダウンロードできます。

gai_aiocr_web.png

2、API方式
お客様が開発したアプリケーションや、他社製のサービスからAPI(アプリケーションプログラムインタフェース)経由で帳票タイプと1ページごとのPDFを渡し、結果のテキストが返されます。

gai_aiocr_api.png

■サービス開始時期とお試し環境について
正式発表:2024年6月(予定)
正式発表後よりWeb画面方式の環境を公開します。
メールアドレスのみで枚数を限定しお試しできる環境と、お客様情報を登録いただいた上でより多くの枚数をお試しできる環境を公開する予定です。

注:
・上記内容は予告なく変更する場合があります。
・当ページに記載されている製品名、会社名は各社の商標または登録商標です。

 

<当サービスに関するお問い合わせ>
下記の「お問い合わせ」ボタンをクリックして、お問い合わせフォーム内の「お問い合わせ種類(その他)」を選択のうえ、ご連絡ください。

関連するプレスリリースはこちら

比較検討や社内説明に役立つ
資料をご用意しております。

導入前のご質問・ご相談など、
お気軽にお問い合わせください。