じゃいぶろぐ

楽天、アマゾン、Yahooなどの販売代行、アプリ・システム開発をしているJIVEの日々 移転しました→https://jivejp.com/blog0/

Acrobat からスキャナ取込 OCR認識させる

 スキャナ取込みの際に文字をテキストとして認識させる方法

https://helpx.adobe.com/jp/acrobat/kb/649.html

 

OCR 機能を使用しない通常の読み込みでは、文字はグラフィックとして取り込まれ、テキストの編集を行うことはできません。

 

1.Acrobat を起動します。
2.ファイル/作成/スキャナーから PDF/カスタムスキャン を選択します。
3.カスタムスキャンダイアログボックスまたはプリセットを設定ダイアログボックの「文書設定」セクションで、「テキスト認識」(Acrobat DC)/「検索可能にする(OCR 実行)」(Acrobat XI)にチェックをいれます。
4.つづけて、「オプション」ボタンをクリックします。
5.「OCR の言語」および「PDF の出力形式」を指定して、「OK」をクリックします。
6.スキャンする。

OCR → 文字」 と認識したか確認する方法

Acrobatのメニューでテキストを選択する下記の「矢印」を選んで、文字部分を範囲しているすると、

f:id:jivejp:20150526113823p:plain

 ①文字と認識した部分→文字に沿って選択マーカーが表示され、右クリックメニューに「コピー」が表示される。

f:id:jivejp:20150526114343p:plain  ここでは「ソリューション」文字の「ソリューシ」まで選択できるので文字変換されている証拠。

 ②文字と認識しない部分→図形のような四角い範囲指定になる。

①でコピーされた文字はメモ帳などに貼り付けると、テキスト化されている。ただし、文字化けすることも多い。

スキャナードライバをインストールしなくても、Acrobat があればスキャンできるのです。

 

株式会社 JIVE
新潟県柏崎市四谷1-4-26 2F
TEL 0257-23-0010 FAX 0257-23-0030
Copyright ©JIVE All Rights Reserved.