Blog

ブログ

データマネジメント

公開日：2021/11/03

【UiPath】活字・手書き文字をOCRする

エニイの事務局代行業務では紙の書類を多く取り扱っており、紙媒体をデータベース化（データ入力）のご依頼も多くいただいております。

そこで、今回はデータ入力業務の課題である「作業効率化」・「正確性の向上」を目指し UiPathでMicrosoft OCRを使用して画像から活字・手書き文字の読み込み～テキスト出力をしてみたいと思います。

まずOCR処理させたい画像を用意します。今回はword作成した文書を印刷し、文字を書き加えてスキャンした画像を使用します。

次にUiPathでワークフローを用意します。

「画像を読み込み」アクティビティ、「Microsoft OCR」アクティビティ、「テキストをファイルに書き込み」アクティビティを下図の様に追加していきます。

アクティビティを用意したらそれぞれプロパティを設定していきます。変更したいアクティビティをクリックして画面右のプロパティパネルから設定を行います。

画像を読み込みアクティビティでは「ファイル名」と「画像」のプロパティを設定します。「ファイル名」は OCR処理させたい画像のパスを設定します。プロパティに文字列を直接設定する場合はダブルクォーテーション括りが必要なので忘れないようにしましょう。（忘れているとエラー表示されます）「画像」はMicrosoft OCRに受け渡す画像データの変数を設定します。

変数は入力欄から作成・設定ができます。「画像」の入力欄の上にカーソルを乗せるとプラスボタンが表示されるのでクリック ⇒表示されるメニューから「変数を作成」をクリック

「変数を作成」をクリックすると入力欄に「変数を設定:」と表示されるのでその右に変数名を入力すると変数が設定できます。変数名は任意ですのでひとまず「TargetImage」としておきます。

まずはMicrosoft OCRに処理させたい画像を受け渡す準備が出来ました。

次のMicrosoft OCRアクティビティのプロパティは「言語」、「画像」、「テキスト」を設定します。

今回は日本語のOCRなので「言語」は「Japanese」、「画像」にはOCRで処理させたい画像を設定するため、先ほど画像読み込みアクティビティで設定した「画像」の変数を設定します。（ここではTargetImage）「テキスト」にはOCRした結果のテキストデータを格納する変数を設定します。画像読み込みアクティビティで設定したように変数を作成・設定すると楽です。変数名はここでは「ResultText」としておきます。