おかげさまで12年目
OCR処理スキャニングの特徴

OCR処理

スキャニングデータは、その後の使用目的によっては、OCR処理を施すことで大幅に利便性が向上します。
OCR処理では、紙媒体を高精度に画像化し、画像に含まれる文字情報(主に活字)を自動で認識してテキストを付与することが可能です。
これにより、スキャニングデータを文字検索することが可能になり、大量のデータの中から一瞬で必要な1枚を探し出すことができるようになります。

OCR処理について

OCRとは、Optical Character Reader(光学式文字読取装置)の略です。
通常、スキャンした画像は文字情報も画像として処理されるため、テキスト情報を持つことはありません。
しかし、OCRで文字認識をさせることで、PDFファイルに透明なテキスト情報を機械的に付与することが可能になります。
文字の認識精度は、原本の状態にかなり依存するものの、きれいな状態の文書であれば、活字を90%以上の精度で正しくテキスト化できると言われています。
文字がかすれていたり、罫線がある、複写を繰り返し汚れている、特殊なフォントを使っている等の文書は精度が下がりますので、注意が必要です。
さらに、手書き文字は認識が難しいとされています。


お気軽にお電話ください

このページのトップへ