Acrobat からスキャナ取込 OCR認識させる
スキャナ取込みの際に文字をテキストとして認識させる方法
https://helpx.adobe.com/jp/acrobat/kb/649.html
OCR 機能を使用しない通常の読み込みでは、文字はグラフィックとして取り込まれ、テキストの編集を行うことはできません。
1.Acrobat を起動します。
2.ファイル/作成/スキャナーから PDF/カスタムスキャン を選択します。
3.カスタムスキャンダイアログボックスまたはプリセットを設定ダイアログボックの「文書設定」セクションで、「テキスト認識」(Acrobat DC)/「検索可能にする(OCR 実行)」(Acrobat XI)にチェックをいれます。
4.つづけて、「オプション」ボタンをクリックします。
5.「OCR の言語」および「PDF の出力形式」を指定して、「OK」をクリックします。
6.スキャンする。
「OCR → 文字」 と認識したか確認する方法
Acrobatのメニューでテキストを選択する下記の「矢印」を選んで、文字部分を範囲しているすると、
①文字と認識した部分→文字に沿って選択マーカーが表示され、右クリックメニューに「コピー」が表示される。
ここでは「ソリューション」文字の「ソリューシ」まで選択できるので文字変換されている証拠。
②文字と認識しない部分→図形のような四角い範囲指定になる。
①でコピーされた文字はメモ帳などに貼り付けると、テキスト化されている。ただし、文字化けすることも多い。
スキャナードライバをインストールしなくても、Acrobat があればスキャンできるのです。