OCR処理で完璧な保存 / 書籍電子化の電子書籍本家|本・コミック・雑誌の電子化サービス

OCR処理で完璧な保存

OCR処理を実行したPDFは全文検索が可能になります。

OCRという言葉には、「技術」を指す場合と、それを可能にする「ソフト」という2つの意味合いがあります。ここでいう「OCR処理」とは技術の方です。「OCR」を日本語に訳すと「光学文字認識」となります。OCR処理とは、画像に含まれる文字をテキストとして認識できるようにする技術のことです。例えば、写真に看板が映っていたとします。看板の文字を検索で探すことはできません。看板の文字はあくまで「絵」であり、パソコンが認識できる「テキスト」ではないからです。OCR処理では、文字の上に透明なテキストを埋め込みます。これにより、看板の文字はテキストとして認識されるようになります。つまりは、検索でヒットするようになるのです。もし画像ファイルが本をスキャンしたPDFであれば、本の全文をテキスト検索できるようになります。

関連画像はこちらから!

« 書籍電子化の電子書籍本家|本・コミック・雑誌の電子化サービス