При автоматическом анализе макета страницы FineReader сам выделяет блоки, содержащие тексты, таблицы, картинки и штрих-коды.
Автоматический анализ запускается по кнопке 2-Распознать одновременно с распознаванием текста. До запуска распознавания необходимо установить основные опции анализа: тип страницы и опции анализа таблиц.
Для большинства изображений расположение текста на странице определяется автоматически, чему соответствует значение Авто на закладке Распознавание в группе Тип страницы (меню Сервис>Опции), устанавливаемое системой по умолчанию.
В некоторых случаях может потребоваться установить значение типа страницы вручную. Для этого:
Автоматическое определение | - указывает, что расположение текста на странице определяется автоматически. Это значение устанавливается системой по умолчанию; подходит для распознавания всех видов текстов, в том числе многоколоночного текста, текста с таблицами и картинками. |
Одна колонка | - указывает, что текст на странице напечатан в одну колонку. Эта опция используется в случае, если автоматическое определение ошибочно сегментировало страницу как многоколоночный текст. |
Форматированный пробелами текст | - указывает, что текст на странице расположен в одну колонку и напечатан моноширинным шрифтом одного размера. В распознанном тексте сохраняется деление на строки; отступы от левого края передаются пробелами; каждая строка выделяется в отдельный абзац, и расстояния между абзацами передаются пустыми строками. Используется, например, для распознавания распечаток текстов программ. |
В большинстве случаев программа делит таблицу на строки и столбцы автоматически. Дополнительная настройка опций анализа таблиц устанавливается на закладке Распознавание в группе Таблицы. Эти опции рекомендуется использовать, если:
Опция В каждой ячейке таблицы не более одной строки текста используется для уверенного анализа таблиц с неполным количеством или без черных разделителей, с ячейками, содержащими не более одной строки текста.
|
- пример таблицы, в каждой ячейке которой текст расположен в одну строку |
||||||
|
- пример таблицы, ячейки которой содержат более одной строки текста |
Опция Таблица не содержит объединенные ячейки используется для уверенного анализа таблиц, не содержащих объединенных ячеек.
|
- пример таблицы с объединенной ячейкой |
Замечание. На таблицах общей структуры или на страницах с таблицами различной структуры отмеченные опции В каждой ячейке таблицы не более одной строки текста и Таблица не содержит объединенных ячеек могут привести к ошибкам анализа и соответственно снизить качество распознавания.
Выделение и редактирование блока вручную | |
Сохранить изображение блока в файл |