Документ, использующий декоративный шрифт
Описание ситуации: много ошибок при
распознавании.
(Training.tif) |
Программа обучена распознаванию
стандартных шрифтов и не
предназначена для распознавания
декоративных шрифтов, например, FuturisXShadowC,
ParagmaticaShadowC, CyrillicGoth. Решение: Для повышения качества
распознавания данного документа
воспользуемся специальным режимом
распознавания: распознавание с
обучением. Обычно в данном
режиме распознаются 1-2 страницы, в
результате чего создается
пользовательский эталон, который
в дальнейшем подключается для
распознавания остальных страниц.
При этом важно помнить, что созданный эталон можно использовать
только для распознавания текстов, использующих
тот же шрифт и размер шрифта и
отсканированных с тем же разрешением, что и документ, на
основе которого данный эталон
создавался.
- Выделите блоки на
изображении (меню Процесс>Анализ
макета страницы или ).
- Установите режим Распознавание с
обучением (на закладке
Распознавание,
меню Сервис>Опции в группе
Распознавание с обучением установите
переключатель в положение Распознавание
с обучением). В строке состояния
появится название эталона (по умолчанию
default).
- Установите язык распознавания (Английский) .
- Нажмите кнопку 2-Распознать.
- Обучите эталон,
распознав страницу в режиме
распознавания с обучением.
Обучаемые символы заносятся в эталон,
создаваемый системой по умолчанию. По
окончании обучения система сохранит
созданный эталон (default.ptn) в
папке, где хранится пакет.
- Отредактируйте эталон .
- Отмените режим Распознавание с
обучением (на закладке Распознавание в группе Обучение установите
переключатель в положение Распознавание с
пользовательским эталоном).
|
|