Диалог "Опции", закладка "Распознавание"

Название опции

Значение опции

Язык распознавания Позволяет выбрать язык распознаваемого текста. 
Если Вы не видите нужного языка в списке или Вы хотите распознать текст, написанный на нескольких языках, нажмите на кнопку Редактор языков. В открывшемся диалоге Редактор языков Вы можете создать новый язык на основе уже существующего или создать новую группу языков. 
Редактор языков (кнопка) Открывает диалог Редактор языков, в котором Вы можете создать новый язык на основе уже существующего или создать новую группу языков.
Группа "Тип страницы"
Авто Указывает, что расположение текста на странице определяется автоматически. Это значение устанавливается системой по умолчанию; подходит для распознавания всех видов текстов, в том числе многоколоночного текста, текста с таблицами и картинками.
Одна колонка Указывает, что текст на странице напечатан в одну колонку. Эта опция используется в случае, если автоматическое определение ошибочно отсегментировало страницу как многоколоночный текст.
Форматированный пробелами текст Указывает, что текст на странице расположен в одну колонку и напечатан моноширинным шрифтом одного размера. В распознанном тексте сохраняется деление на строки; отступы от левого края передаются пробелами; каждая строка выделяется в отдельный абзац, и расстояния между абзацами передаются пустыми строками. Используется, например, для распознавания распечаток текстов программ.
Очищать фон
(Clear background noise)
Удаляет фон документа. Используется только для распознавания черно-белых изображений документов, имеющих некоторую подложку или равномерный фон (например, журнальные статьи, газеты).
Замечание:
  1. Опция Очищать фон убирает фон с временного изображения, используемого программой при распознавании; исходное изображение остается без изменений.
  2. Если в распознанном документе на месте картинки находится текст (при этом текст содержит много ошибок), то это означает что в результате действия опции Очищать фон картинка была воспринята программой как текст, требующий распознавания. Если Вы хотите, чтобы распознанный текст содержал именно картинку, то снимите отметку с пункта Очищать фон.
Искать штрих-коды Указывает, что в распознаваемом документе содержатся штрих-коды. Тогда, при анализе документа система выделит их в отдельные блоки типа штрих-код и при распознавании переведет их в последовательность букв и цифр.
По умолчанию данный пункт не отмечен.
Группа "Тип печати"
Авто Указывает, что тип печати определяется автоматически. Это значение устанавливается системой по умолчанию. Подходит для всех типов печати.
Пишущая машинка Указывает, что текст в документе напечатан на печатной машинке; позволяет повысить качество распознавания.
Матричный принтер Указывает, что текст в документе напечатан на матричном принтере; позволяет повысить качество распознавания.
Группа "Таблицы"
В каждой ячейке таблицы не более одной строки текста Устанавливается для таблиц, ячейки которой содержат текст, напечатанный в одну строку. Позволяет разрешить неоднозначности, возникающие в случае при делении на строки строчных таблиц без черных разделителей.
Таблица не содержит объединенных ячеек Устанавливается для более уверенного анализа таблиц без объединенных ячеек.
Группа "Обучение"
Не использовать пользовательский эталон Устанавливается системой по умолчанию для распознавания большинства документов.
Распознавание с обучением Устанавливается для проведения распознавания с обучением. В режиме Распознавание с обучением при нажатии на кнопку 2-Распознать открывается диалог Ручное обучение эталона, в котором и происходит обучение системы распознаваемым символам.
Внимание! Созданный эталон можно использовать только для распознавания документов того же пункта и шрифта  и отсканированных с тем же разрешением, что и страницы, на которых происходило обучение.
Распознавание с пользовательским эталоном Устанавливается для проведения распознавания с подключенным пользовательским эталоном.
Эталоны Открывает диалог Редактор эталонов, в котором Вы можете создать, переименовать, удалить, отредактировать и подключить (Выбрать) эталон.
Использовать встроенные эталоны Указывает, что при распознавании используются встроенные в систему эталоны; опция по умолчанию отмечена. При обучении программы декоративным шрифтам или нестандартным шрифтам (например, тибетскому) опцию Использовать встроенные эталоны следует отключить.