Опции автоматического анализа макета страницы

При автоматическом анализе макета страницы FineReader сам выделяет блоки, содержащие тексты, таблицы, картинки и штрих-коды.

Автоматический анализ запускается по кнопке 2-Распознать одновременно с распознаванием текста. До запуска распознавания необходимо установить основные опции анализа: тип страницы и опции анализа таблиц.

Тип страницы

Для большинства изображений расположение текста на странице определяется автоматически, чему соответствует значение Авто на закладке Распознавание в группе Тип страницы (меню Сервис>Опции), устанавливаемое системой по умолчанию.

В некоторых случаях может потребоваться установить значение типа страницы вручную. Для этого:

Возможные типы страницы:

Автоматическое определение - указывает, что расположение текста на странице определяется автоматически. Это значение устанавливается системой по умолчанию; подходит для распознавания всех видов текстов, в том числе многоколоночного текста, текста с таблицами и картинками.
Одна колонка - указывает, что текст на странице напечатан в одну колонку. Эта опция используется в случае, если автоматическое определение ошибочно сегментировало страницу как многоколоночный текст. 
Форматированный пробелами текст - указывает, что текст на странице расположен в одну колонку и напечатан моноширинным шрифтом одного размера. В распознанном тексте сохраняется деление на строки; отступы от левого края передаются пробелами; каждая строка выделяется в отдельный абзац, и расстояния между абзацами передаются пустыми строками. Используется, например, для распознавания распечаток текстов программ.

Опции анализа таблиц

В большинстве случаев программа делит таблицу на строки и столбцы автоматически. Дополнительная настройка опций анализа таблиц устанавливается на закладке Распознавание в группе Таблицы. Эти опции рекомендуется использовать, если:

  1. Опция В каждой ячейке таблицы не более одной строки текста используется для уверенного анализа таблиц с неполным количеством или без черных разделителей, с ячейками, содержащими не более одной строки текста.

    Kilometers Miles
    1 0.62
    5 3.2

    - пример таблицы, в каждой ячейке которой текст расположен в одну строку 

    Физ.явление t по Цельсию
    Температура кипения воды 100
    Температура замерзания воды 0

    - пример таблицы, ячейки которой содержат более одной строки текста

  2. Опция Таблица не содержит объединенные ячейки используется для уверенного анализа таблиц, не содержащих объединенных ячеек.

  3. Температура
    По Цельсию По Кельвину
    -273 0
    100 373

    - пример таблицы с объединенной ячейкой

Замечание. На таблицах общей структуры или на страницах с таблицами различной структуры отмеченные опции В каждой ячейке таблицы не более одной строки текста и Таблица не содержит объединенных ячеек могут привести к ошибкам анализа и соответственно снизить качество распознавания.

Выделение и редактирование блока вручную
Сохранить изображение блока в файл