Примеры

Программная распечатка

Описание ситуации: данный пример имеет две особенности, влияющие на качество распознавания:

  • программа передает отступы от левого края листа не пробелами, а с помощью задания отступов абзаца; при экспорте в .txt левый отступ не сохраняется; некоторые строки объединяются в один абзац и при экспорте объединяются в одну строку;
  • много ошибок при распознавании конструкций языков программирования.

(Listing.tif)

Решение:
  1. Для распознавания таких документов существует специальная опция программы Форматированный пробелами текст. Устанавливается в группе Тип страницы на закладке Распознавание диалога Опции (меню Сервис>Опции).

    В этом случае в распознанном тексте сохранится деление на строки; отступы от левого края будут  переданы пробелами; каждая строка выделена в отдельный абзац, а расстояния между абзацами переданы пустыми строками. Все это позволит сохранить исходное форматирование текста при сохранении в формате Txt.

  2. Для хорошего распознавания распечаток программ требуется установить специальный язык распознавания. Для этого:
    • В списке языков на панели Стандартная выберите значение Выбор из полного списка языков и в открывшемся диалоге Язык распознаваемого текста выберите пункт C++.
    Замечание Если распознаваемая программная распечатка помимо программного кода содержит текстовые комментарии, то для хорошего распознавания необходимо выбрать несколько языков распознавания: язык программирования и язык, на котором написаны комментарии.