登録日:2017年12月4日
最終更新日:2022年10月31日
コンテンツID:00528
対象環境
DocuWorks 8
概要
DocuWorks文書のOCRした結果をExcelやWord(RTF)形式に変換する方法をご案内します
操作方法
- OCRできるDocuWorks文書の種別
DocuWorks文書には「アプリケーション文書」と「イメージ文書」があります。
OCRを行うには「イメージ文書」である必要があります。 - アプリケーション文書、イメージ文書を確認する
DocuWorks Deskの「プロパティ」で確認します。
DocuWorks Deskメニューの[表示]>[インフォビュー]>[プロパティ]を開き、確認したいDocuWorks文書を選択します。 - イメージ文書へ変換する
[オリジナル種別]が「アプリケーション文書」である場合、「イメージ文書」に変換することでOCRを行うことができます。 イメージ文書にしたいDocuWorks文書を選択し、[ページの加工]プラグインをクリックします。 - 「OCRしてExcel変換」する
イメージ文書に変換したDocuWorksファイルを選択し、「OCRしてExcel変換」プラグインをクリックします。
参考1.OCR処理結果が文字化けするなどうまくいかない場合
- お仕事バーの便利な機能内[OCR]を右クリックし、プロパティを開く
- OCR(文字認識)設定画面で以下を変更する
OCRに渡すイメージのノイズ除去をする:ふつう
カラーイメージに対するOCR処理:白黒に変換して認識率を優先する - [OCRの詳細設定]>全般タブにある[認識モード]を[認識率優先]に変更してOKで閉じる
DocuWorksはOCRに特化したソフトウェアではないため、一般的なOCRソフトに比べ、OCRの精度が高くありません。
OCRの設定を調整いただいても改善されない場合は、OCR結果に正しい値を直接ご入力ください。
参考2.Excelの表のOCR結果でExcelの表が1列に出力されてしまうなどうまくいかない場合
- お仕事バーの便利な機能内[OCR]を右クリックし、プロパティを開く
- ダイアログ左側の[OCRの詳細設定]>全般タブにある[認識モード]を[認識率優先]に変更する
- 原稿レイアウトを[表]に変更してOKで閉じる
- 再度、OCR処理をおこなう