Название опции |
Значение опции |
Язык распознавания | Позволяет выбрать язык распознаваемого текста. Если Вы не видите нужного языка в списке или Вы хотите распознать текст, написанный на нескольких языках, нажмите на кнопку Редактор языков. В открывшемся диалоге Редактор языков Вы можете создать новый язык на основе уже существующего или создать новую группу языков. |
Редактор языков (кнопка) | Открывает диалог Редактор языков, в котором Вы можете создать новый язык на основе уже существующего или создать новую группу языков. |
Группа "Тип страницы" | |
---|---|
Авто | Указывает, что расположение текста на странице определяется автоматически. Это значение устанавливается системой по умолчанию; подходит для распознавания всех видов текстов, в том числе многоколоночного текста, текста с таблицами и картинками. |
Одна колонка | Указывает, что текст на странице напечатан в одну колонку. Эта опция используется в случае, если автоматическое определение ошибочно отсегментировало страницу как многоколоночный текст. |
Форматированный пробелами текст | Указывает, что текст на странице расположен в одну колонку и напечатан моноширинным шрифтом одного размера. В распознанном тексте сохраняется деление на строки; отступы от левого края передаются пробелами; каждая строка выделяется в отдельный абзац, и расстояния между абзацами передаются пустыми строками. Используется, например, для распознавания распечаток текстов программ. |
Очищать фон (Clear background noise) |
Удаляет фон документа. Используется только для распознавания
черно-белых изображений документов, имеющих некоторую подложку или
равномерный фон (например, журнальные статьи, газеты). Замечание:
|
Искать штрих-коды | Указывает, что в распознаваемом документе содержатся
штрих-коды. Тогда, при анализе документа система выделит их в
отдельные блоки типа штрих-код и при распознавании переведет их в
последовательность букв и цифр. По умолчанию данный пункт не отмечен. |
Группа "Тип печати" | |
Авто | Указывает, что тип печати определяется автоматически. Это значение устанавливается системой по умолчанию. Подходит для всех типов печати. |
Пишущая машинка | Указывает, что текст в документе напечатан на печатной машинке; позволяет повысить качество распознавания. |
Матричный принтер | Указывает, что текст в документе напечатан на матричном принтере; позволяет повысить качество распознавания. |
Группа "Таблицы" | |
В каждой ячейке таблицы не более одной строки текста | Устанавливается для таблиц, ячейки которой содержат текст, напечатанный в одну строку. Позволяет разрешить неоднозначности, возникающие в случае при делении на строки строчных таблиц без черных разделителей. |
Таблица не содержит объединенных ячеек | Устанавливается для более уверенного анализа таблиц без объединенных ячеек. |
Группа "Обучение" | |
Не использовать пользовательский эталон | Устанавливается системой по умолчанию для распознавания большинства документов. |
Распознавание с обучением | Устанавливается для проведения распознавания с обучением. В
режиме Распознавание с обучением при нажатии на кнопку
2-Распознать открывается диалог Ручное обучение
эталона, в котором и происходит обучение системы распознаваемым
символам. Внимание! Созданный эталон можно использовать только для распознавания документов того же пункта и шрифта и отсканированных с тем же разрешением, что и страницы, на которых происходило обучение. |
Распознавание с пользовательским эталоном | Устанавливается для проведения распознавания с подключенным пользовательским эталоном. |
Эталоны | Открывает диалог Редактор эталонов, в котором Вы можете создать, переименовать, удалить, отредактировать и подключить (Выбрать) эталон. |
Использовать встроенные эталоны | Указывает, что при распознавании используются встроенные в систему эталоны; опция по умолчанию отмечена. При обучении программы декоративным шрифтам или нестандартным шрифтам (например, тибетскому) опцию Использовать встроенные эталоны следует отключить. |