Улучшение результатов конвертирования PDF-документа


Если не сохранено оформление исходного PDF-документа:

  1. Проверьте выбранный режим в поле Сохранение оформления.
  2. Отредактируйте полученные в результате автоматического анализа области или разметьте текстовые, табличные и графические области вручную. Подробнее о работе с областями описано в разделе Выделение и редактирование областей вручную.

  3. Проверьте ориентацию текста в текстовых областях. Подробнее о работе с областями описано в разделе Выделение и редактирование областей вручную.

Если в полученном тексте много ошибок:

  1. Проверьте языки, указанные в поле Языки PDF-документа.
    Чтобы выбрать нужный язык (или несколько языков), нажмите Изменить… Если нужного языка нет в списке Языки PDF-документа , значит данный язык не поддерживается программой ABBYY PDF Transformer 2.0. Полный список языков приведен в разделе Поддерживаемые языки конвертирования.

    Совет. Если PDF-документ написан более, чем на трех языках, конвертируйте его по частям. Для этого выделите текстовые области, написанные на одном языке, укажите диапазон конвертируемых страниц и язык конвертируемого фрагмента (подробнее см. Выделение и редактирование областей вручную).

  2. Включите опцию Как изображение в поле Режим конвертирования.
    Программа ABBYY PDF Transformer 2.0 извлекает текстовые данные из PDF-документа и использует их при конвертировании.
    Если исходный PDF-документ содержит фрагменты, для набора которых были использованы специальные символы или нестандартный шрифт, то в полученном документе такие фрагменты могут отображаться некорректно (например, в словах на месте некоторых букв будут стоять значки "?" или "□").
    Для улучшения результата конвертирования, рекомендуется включить опцию Как изображение и конвертировать исходный PDF-документ повторно.
    В данном случае программа ABBYY PDF Transformer 2.0 использует технологию оптического распознавания символов (Optical Character Recognition - OCR), которая позволяет конвертировать любые PDF-документы (в том числе Image only), напечатанные практически любыми шрифтами. При этом обработка PDF-документа программой ABBYY PDF Transformer 2.0 включает в себя анализ страницы как "фотографии" и распознавание каждого символа. В результате распознанный текст будет конвертирован в выбранное приложение.


Краткое содержание раздела:

Анализ страницы, области

Выделение и редактирование областей вручную