ABBYY Software House

 ABBYY FineReader
Обучение на примерах содержит описание возможностей программы, улучшающих качество распознавания документов различных типов 

Содержание
Быстрое знакомство
Примеры

Простое письмо

Многоязычный документ

Книжный разворот

Факсы

Сложная журнальная страница

Газетная страница

PDF документ

Простая таблица

Таблица с неполным количеством черных разделителей

Сложная таблица

Работа с визитными карточками

Работа с презентациями PowerPoint

Программная распечатка

Документ, использующий декоративный шрифт

Документ с артикулами

Фотография документа

Советы

Программная распечатка

Описание ситуации:  данный пример имеет две особенности, влияющие на качество распознавания:

  • программа передает отступы от левого края листа не пробелами, а с помощью задания отступов абзаца; при экспорте в .txt левый отступ не сохраняется; некоторые строки объединяются в один абзац и при экспорте объединяются в одну строку;
  • много ошибок при распознавании конструкций языков программирования.
Code printouts

(listing.tif)

Решение:

  1. Для распознавания таких документов существует специальная опция программы Распознать как форматированный пробелами текст. Отметьте эту опцию в  диалоге Дополнительные опции в группе Распознать. Для того чтобы открыть этот диалог,  нажмите кнопку Дополнительные опции на закладке Общие диалога Опции (меню Сервис>Общие).
    В этом случае в распознанном тексте сохранится деление на строки; отступы от левого края будут  переданы пробелами; каждая строка выделена в отдельный абзац, а расстояния между абзацами переданы пустыми строками. Все это позволит сохранить исходное форматирование текста при сохранении в формате Txt.
  2. Для хорошего распознавания распечаток программ требуется установить специальный язык распознавания. Для этого:
    • В списке языков на панели Стандартная выберите значение Выбор из полного списка языков и в открывшемся диалоге Язык распознаваемого текста выберите пункт C++.
    Замечание. Если распознаваемая программная распечатка помимо программного кода содержит текстовые комментарии, то для хорошего распознавания необходимо выбрать несколько языков распознавания: язык программирования и язык, на котором написаны комментарии.
office@abbyy.com
© 1996-2005 ABBYY Software