Hollywood の文字認識を行いたい。
取り込んだ画像は、単語の間で改行され以下の記述となっている。
Holl
ywood
英語モードにて、属性変更の変換タブ内の「空白(先頭):なし」
「改行:なし」を選択した。
認識をかけたが、以下のように、認識結果の間に空白が入ってしまいます。
Holl ywood
読取革命Ver.12以降では、
『英語モードでOCR処理の際に「改行なし」の設定をした場合、
OCR処理後のテキスト表示で、行末の単語と次の行先頭の
単語がひとまとまりになり、単語の意味が通じなくなる』
という問題に対応するため、下記のように「改行」を「空白」と置き換える
ような仕様となっております。
※画像ファイルに、以下のような記述があった場合の認識結果
例:
This is
a pen.
旧バージョンでの認識結果 :This isa pen.
読取革命Ver.12以降での認識結果 :This is a pen.
この仕様により、Ver.12では、上記設定内容で認識した場合、
空白なし/ありに関わらず、改行として認識された箇所が空白に
置き換わります。
読取革命Ver.12以降の仕様となるため、何卒ご了承頂きますように
お願い致します。
お手数ではございますが、下記の回避策にて、ご使用を
ご検討頂きますようにお願い致します。
回避策1:
属性変更の変換タブにて、改行設定を「行毎」に設定して認識させ、
改行を削除して頂く。
回避策2:
改行設定は「なし」に設定したままで認識させ、先頭の空白を
削除して頂く。