自動文字抽出ができない(宛先、作成日、管理番号、期日)
コンテンツID(3011)
概要
[文字列の自動抽出]で[する(見積書)]または[する(請求書)]を選んだときに発生する事象について、その対処方法を説明します。
- 宛先、作成日、管理番号、期日のすべての項目の文字が抽出されない
- 宛先の文字が抽出されない
- 宛先が想定外の文字列で抽出される
- 作成日の文字が抽出されない
- 作成日が想定外の日付で抽出される
- 管理番号の文字が抽出されない
- 管理番号が想定外の文字列で抽出される
- 期日の文字が抽出されない
- 期日が想定外の文字列で抽出される
- OCRは100%の精度を保証するものではありません。対象の文字列を抽出できても、誤った文字として認識される場合があります。
宛先、作成日、管理番号、期日のすべての項目の文字が抽出されない
- 対象の原稿が、自動正立できる原稿かどうかを確認してください。
自動正立できない原稿は、文字を抽出できません。
宛先の文字が抽出されない
次の条件をすべて満たす場合に、宛先の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。
- OCR推奨条件を満たしている。
- 「御中」「様」「殿」などシステムが宛先名と判断できるキーワードが、宛先名の直後にある。
- 横書き文字である。
- 日本語である。
宛先が想定外の文字列で抽出される
- 「御中」「様」「殿」などシステムが宛先名と判断できるキーワードが、原稿内に複数ないか確認してください。
複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。 - 宛先名の長さが最大値を超えていないか確認してください。
宛先名の最大長は64バイトです。最大長を超えた文字は切り捨てられます。
作成日の文字が抽出されない
次の条件をすべて満たす場合に、作成日の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。
- OCR推奨条件を満たしている。
- 横書き文字である。
- 「作成日」「発行日付」などシステムが作成日と判断できるキーワードが、作成日の直前にある。
または、「平成** 年** 月** 日」「**** 年** 月** 日」「****/**/**」 などシステムが作成日と判断できる形式になっている。補足- 文書種類の設定の[作成日]>[日付形式]は、抽出した作成日をフォルダー名やファイル名に利用する場合の日付形式です。読み取り形式を指定するものではありません。
作成日が想定外の日付で抽出される
- 「作成日」「発行日付」などシステムが作成日と判断できるキーワードや、「平成**年**月**日」「****年**月**日」「****/**/**」などシステムが作成日と判断できる文字が、原稿内に複数ないか確認してください。
複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。
管理番号の文字が抽出されない
次の条件をすべて満たす場合に、管理番号の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。
- OCR推奨条件を満たしている。
- 「見積書番号」「請求書番号」などシステムが管理番号と判断できるキーワード、または管理番号用に指定した項目名が、管理番号の直前にある。
補足
- 文書種類の設定の[管理番号]>[項目名]で、管理番号を抽出するための任意キーワードを指定できます。
操作方法は「管理番号に任意の文字列を指定する」を参照してください。
ApeosPort/DocuCentreシリーズの場合、操作方法は「管理番号に任意の文字列を指定する」を参照してください。
- 文書種類の設定の[管理番号]>[項目名]で、管理番号を抽出するための任意キーワードを指定できます。
管理番号が想定外の文字列で抽出される
- 「見積書番号」「請求書番号」などシステムが管理番号と判断できるキーワードが、原稿内に複数ないか確認してください。
複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。 - 管理番号の長さが最大値を超えていないか確認してください。
管理番号の最大長は20バイトです。最大長を超えた文字は切り捨てられます。
期日の文字が抽出されない
次の条件をすべて満たす場合に、期日の文字を抽出できます。対象の原稿が条件を満たしているか確認してください。
- OCR推奨条件を満たしている。
- 「有効期限」「お支払い期限」などシステムが期日と判断できるキーワード、または期日用に指定した項目名が、期日の直前にある。
補足
- 文書種類の設定の[期日]>[項目名]で、期日を抽出するための任意キーワードを指定できます。
操作方法は「期日に任意の文字列を指定する」を参照してください。
ApeosPort/DocuCentreシリーズの場合、操作方法は「期日に任意の文字列を指定する」を参照してください。
- 文書種類の設定の[期日]>[項目名]で、期日を抽出するための任意キーワードを指定できます。
期日が想定外の文字列で抽出される
- 「有効期限」「お支払い期限」などシステムが期日と判断できるキーワードが、原稿内に複数ないか確認してください。
複数あった場合は、文字サイズに関係なく、システムが特定の優先度で文字列を抽出します。 - 期日の長さが最大値を超えていないか確認してください。
期日の最大長は32バイトです。最大長を超えた文字は切り捨てられます。
手順(Apeos/ApeosProシリーズの場合)
管理番号に任意の文字列を指定する
-
インターネットサービスを起動し、業務別らくらくスキャンの文書種類を設定します。
このとき、検索キーワードにしたい文字列を[管理番号]>[項目名]に入力します。
ここでは、[管理番号]>[項目名]に「顧客コード」と入力する場合を例に説明します。 -
複合機で業務別らくらくスキャンを起動し、スキャンを実行します。
指定したキーワード(「顧客コード」)で検索された文字列が抽出されます。 -
内容を確認し、[送信]を押します。
期日に任意の文字列を指定する
-
インターネットサービスを起動し、業務別らくらくスキャンの文書種類を設定します。
このとき、検索キーワードにしたい文字列を[期日]>[項目名]に入力します。
ここでは、[期日]>[項目名]に「対象日」と入力する場合を例に説明します。 -
複合機で業務別らくらくスキャンを起動し、スキャンを実行します。
指定したキーワード(「対象日」)で検索された文字列が抽出されます。 -
内容を確認し、[送信]を押します。
手順(ApeosPort/DocuCentreシリーズの場合)
管理番号に任意の文字列を指定する
-
CentreWare Internet Servicesを起動し、業務別らくらくスキャンの文書種類を設定します。
このとき、検索キーワードにしたい文字列を[管理番号]>[項目名]に入力します。
この例では「顧客コード」と入力しています。
-
複合機で業務別らくらくスキャンを起動し、スキャンを実行します。
指定したキーワード(「顧客コード」)で検索された文字列が抽出されます。
-
内容を確認し、[送信]を押します。
期日に任意の文字列を指定する
-
CentreWare Internet Servicesを起動し、業務別らくらくスキャンの文書種類を設定します。
このとき、検索キーワードにしたい文字列を[期日]>[項目名]に入力します。
この例では「対象日」と入力しています。
-
複合機で業務別らくらくスキャンを起動し、スキャンを実行します。
指定したキーワード(「対象日」)で検索された文字列が抽出されます。
-
内容を確認し、[送信]を押します。
OCR推奨条件
項目 | 推奨条件 |
---|---|
原稿 | プリント出力した原本であること(ファクス出力、繰り返しコピーした原稿は不可) |
書体 | ゴシック体、明朝体 |
文字(活字) | JIS 第一水準漢字、JIS 第二水準漢字(一部)、英字、数字、ひらがな、カタカナ、ギリシャ文字 |
文字サイズ | 8 ~ 24 ポイント |
- 次の文字は正しく抽出できない可能性があります。
- 小さいサイズの文字
- デザイン文字(行書体、ポップ体、毛筆体など)
- 色が薄い文字
- 白抜き文字
- 罫線と接触している文字
- 取り消し線が引かれている文字
- 印鑑が押されている文字
- 画質が劣化した文字(ファクス画像、コピー画像)
- 傾いた文字
- 縦長に変倍された文字