Примеры

Документ, использующий декоративный шрифт

Описание ситуации: много ошибок при распознавании.

(Training.tif)

Программа обучена распознаванию стандартных шрифтов и не предназначена для распознавания декоративных шрифтов, например, FuturisXShadowC, ParagmaticaShadowC, CyrillicGoth.

Решение: Для повышения качества распознавания данного документа воспользуемся специальным режимом распознавания: распознавание с обучением. Обычно в данном режиме распознаются 1-2 страницы, в результате чего создается пользовательский эталон, который в дальнейшем подключается для распознавания остальных страниц. При этом важно помнить, что созданный эталон можно использовать только для распознавания текстов, использующих тот же шрифт и размер шрифта и отсканированных с тем же разрешением, что и документ, на основе которого данный эталон создавался.

  1. Выделите блоки на изображении (меню Процесс>Анализ макета страницы или ).
  2. Установите режим Распознавание с обучением (на закладке Распознавание, меню Сервис>Опции в группе Распознавание с обучением установите переключатель в положение Распознавание с обучением). В строке состояния появится название эталона (по умолчанию default).
  3. Установите язык распознавания (Английский)  .
  4. Нажмите кнопку 2-Распознать.
  5. Обучите эталон, распознав страницу в режиме распознавания с обучением.
    Обучаемые символы заносятся в эталон, создаваемый системой по умолчанию. По окончании обучения система сохранит созданный эталон (default.ptn) в папке, где хранится пакет.
  6. Отредактируйте эталон .
  7. Отмените режим Распознавание с обучением (на закладке Распознавание в группе Обучение установите переключатель в положение Распознавание с пользовательским эталоном).