領域指定の文字抽出ができない(読み取り領域1~4)

コンテンツID(3012

概要

[文字列の自動抽出]で読み取り領域を設定した場合に発生する事象について、その対処方法を説明します。

補足
  • OCRは100%の精度を保証するものではありません。対象の文字列を抽出できても、誤った文字として認識される場合があります。

読み取り領域1~4のすべての文字が抽出されない

  • 対象の原稿が、自動正立できる原稿かどうかを確認してください。
    自動正立できない原稿は、文字を抽出できません。
  • 文書種類に設定されている[文字列の自動抽出]>[認識言語]を確認してください。
    [文字列の自動抽出]>[認識言語]と異なる言語で書かれた原稿は、文字列の抽出ができません。[認識言語]は、何も指定しない場合、複合機の表示言語が設定されています。
補足
  • [文字列の自動抽出]で[する(請求書)]または[する(見積書)]を設定した場合は、[読み取り領域4]は使用できません。

特定の読み取り領域の文字が抽出されない

次の条件をすべて満たす場合に、領域内の文字列を抽出できます。対象の原稿が条件を満たしているか確認してください。

補足

特定の読み取り領域が想定外の文字で抽出される

  • 対象の文字列の長さが、設定されている読み取り文字数を超えていないか確認してください。
    読み取り文字数を超えた文字は、切り捨てられます。初期値は、英語以外で20文字、英語で60バイトです。

    補足
    補足
  • 対象の文字列が、読み取り領域内に配置されているか確認してください。
    領域設定時に想定した原稿と異なるレイアウトの原稿を使用していると、文字が領域からずれたり、はみだしたりして正しく抽出できないことがあります。
    なお、対象の文字列に接近した文字列があると、その文字列も抽出されてしまうことがあります。
    はみだしたりして正しく抽出できないことがあります
    その文字列も抽出されてしまうことがあります

    定規などで計測して、設定した座標内に文字列が配置されているか確認してください。
    各座標は原稿左上を起点にして、mm(ミリメートル)の単位で指定できます。

    補足
    補足
  • 対象の文字列に対して、読み取り領域の幅、高さが小さすぎないか確認してください。
    領域設定時に想定した文字より長い文字列を対象とする場合は、座標の変更が必要です。
    領域からはみ出した部分は抽出されない

    スキャン時の引き込み誤差などによって、最大で3mm程度、読み取り座標にずれが生じることがあります。このため、抽出したい文字列に対して前後左右3mm以上、余裕がある座標を設定してください。
    また、同様の理由により、設定した領域の前後左右3mm以内に文字が配置されている場合は、その文字も抽出されることがあります。抽出したい文字の周囲3mmが空白であることを推奨します。
    推奨以外の領域を設定した場合、余分な文字を抽出することがあります。その場合は[文字列の抽出結果]画面で文字を編集(削除)してください。

    抽出したい文字の周囲3mm大きめにマーキングすることを推奨します
     

  • 読み取り領域1~4に同一の領域名がないか確認してください。
    同一の領域名がある場合、意図しない読み取り領域の読み取り結果が使用される場合があります。読み取り領域1~4の領域名は必ず別名にしてください。

手順(Apeos/ApeosProシリーズの場合)

読み取り文字数を確認、変更する

  1. インターネットサービスから業務別らくらくスキャンを起動し、対象の文書種類の編集画面を表示します。

  2. 修正したい読み取り領域の[領域設定]をクリックします。

  3. [読み取り文字数を指定する]で読み取り文字数を指定して[OK]をクリックします。

  4. [新しい設定を適用]をクリックします。

読み取り領域の座標を確認、修正する

  1. インターネットサービスから業務別らくらくスキャンを起動し、対象の文書種類の編集画面を表示します。

  2. 修正したい読み取り領域の[領域設定]をクリックします。

  3. [数値で入力する]を選び、各値を修正して[OK]をクリックします。

  4. [新しい設定を適用]をクリックします。

手順(ApeosPort/DocuCentreシリーズの場合)

読み取り文字数を確認、変更する

  1. CentreWare Internet Servicesから業務別らくらくスキャンを起動し、対象の文書種類の編集画面を表示します。

  2. 修正したい読み取り領域の[領域設定]をクリックします。

    image
     
  3. [読み取り文字数を指定する]にチェックを付け、読み取り文字数を指定して[OK]をクリックします。

    image
     
  4. [新しい設定を適用]をクリックします。

読み取り領域の座標を確認、修正する

  1. CentreWare Internet Servicesから業務別らくらくスキャンを起動し、対象の文書種類の編集画面を表示します。

  2. 修正したい読み取り領域の[領域設定]をクリックします。

    image
     
  3. [数値で入力する]を選び、各値を修正して[OK]をクリックします。

    image
     
  4. [新しい設定を適用]をクリックします。

OCR推奨条件

項目 推奨条件
原稿 プリント出力した原本であること(ファクス出力、繰り返しコピーした原稿は不可)
書体 ゴシック体、明朝体
文字(活字) JIS 第一水準漢字、JIS 第二水準漢字(一部)、英字、数字、ひらがな、カタカナ、ギリシャ文字
文字サイズ 8 ~ 24 ポイント
補足
  • 次の文字は正しく抽出できない可能性があります。
    • 小さいサイズの文字
    • デザイン文字(行書体、ポップ体、毛筆体など)
    • 色が薄い文字
    • 白抜き文字
    • 罫線と接触している文字
    • 取り消し線が引かれている文字
    • 印鑑が押されている文字
    • 画質が劣化した文字(ファクス画像、コピー画像)
    • 傾いた文字
    • 縦長に変倍された文字