Глоссарий

А Б Д З И К Л М Н О П Р С Т Ф Ш Э Я

ADF (Automatic Document Feeder) - устройство автоматической подачи бумаги, позволяющее отсканировать большое количество документов без ручного вмешательства. FineReader поддерживает сканирование многостраничных документов.

dpi (Dots per Inch) - количество точек на дюйм; единица измерения разрешения.

Hot folder - специальный режим открытия отсканированных изображений, при котором эти изображения будут автоматически открываться в окне программы по мере их поступления в указанную пользователем папку.

Open&Read - запускает обработку изображения: открытие, анализ макета страницы и распознавание.

Scan&Read - главная кнопка программы, по нажатию на которую система сканирует изображение и распознает (анализирует макет страницы и распознает документ).

TWAIN, TWAIN-диалог - диалог сканера.

Unicode - стандарт, разработанный концерном Unicode. Управляет процессом кодирования символов и предоставляет шестнадцатибитную международную расширяемую систему кодировки символов для обработки информации на большинстве языков народов мира. Стандарт Unicode определяет кодировку символа, а также свойства и алгоритмы, используемые при реализации этого процесса.

А

Аббревиатура - сокращение, образованное из начальных букв слов. Например, МГУ, MS-DOS и т.д.

Активация - процесс получения пользователем в компании ABBYY специального кода, необходимого для обеспечения работы программы в полнофункциональном режиме на конкретном компьютере.

Активационный код - код, который выдается пользователю после прохождения процедуры активации (для версии Professional Edition). Предназначен для активации продукта на той машине, на которой был получен Installation ID.

Активационный файл – файл, который выдается пользователю после прохождения процедуры активации (для версии Corporate Edition). В нем содержится информация, необходимая для активации сервера или компьютера (в случае установки на отдельное рабочее место). Рабочие станции активируются сервером.

Автоподбор яркости - автоматический подбор яркости, производится сканером или системой FineReader. Автоподбор позволяет подбирать яркость для каждого участка изображения в отдельности.

Активный блок - блок, над которым выполняется большинство производимых действий (например, удаление, изменение типа и т.д.). На углах такого блока имеются "квадратики".

Анализ макета страницы (выделение блоков) - процесс выделения блоков на изображении. Блоки могут быть разных типов. Анализ макета может проводиться автоматически одновременно с распознаванием при нажатии кнопки 2-Распознать или вручную до распознавания.

Б

Блок - участок изображения, выделенный в рамку.

Блок Картинка - этот блок используется для обозначения картинок. Он может содержать картинку или любую другую часть текста, которую Вы хотите передать в распознанный текст в качестве картинки.

Блок Штрих-код (только в версии Corporate Edition) - этот блок используется для распознавания штрих-кодов. Т.е., если Ваш документ содержит штрих-код и Вы хотите передать его не в качестве картинки, а перевести его в последовательность букв и цифр, то выделите штрих-код в отдельный блок и присвойте ему тип Штрих-код.
Замечание. По умолчанию опция, позволяющая искать и распознавать штрих-коды, отключена. Чтобы подключить ее, отметьте пункт Выделять штрих-коды на закладке Распознавание (меню Сервис>Опции).

Д

Драйвер - программа, управляющая устройством.

К началу

З

Запрещенные символы - в качестве запрещенных символов для текущего языка указываются те, которые заведомо не могут встречаться в текстах, распознаваемых с подключением данного языка. Указание таких символов может существенно увеличить скорость и надежность распознавания. Например, при распознавании текстов, в которых встречаются только заглавные буквы, в качестве запрещенных следует указать все строчные буквы.

Зона распознавания - блок используется для распознавания и автоматического анализа части изображения. После нажатия на кнопку 2-Распознать выделенный блок автоматически анализируется и распознается.

И

К началу

Игнорируемые символы - в качестве игнорируемых символов указываются те, которые могут встречаться внутри слова, например, знаки слогоделения или ударения в словарях. При проверке по словарю программа не учитывает эти знаки. В распознанном тексте эти символы сохраняются, но при проверке орфографии не учитываются.

Инвертированное изображение - изображение, текст которого напечатан на темном фоне светлыми буквами.

К

К началу

Кодовая страница - таблица, в которой задано отношение между кодами символов и их начертаниями. В системе FineReader  кодовая страница представлена как набор символов, из которого можно выбрать нужные символы.

Л

К началу

Лигатура - пара или тройка букв, которые из-за особенностей начертания склеиваются между собой. Например, ге, го, fe, ffi, tt и т.п.

М

Мастер Scan&Read - специальный режим сканирования и распознавания, в котором система контролирует действия пользователя и подсказывает ему, что делать, чтобы получить тот или иной результат.

Макет страницы - расположение текста, таблиц и картинок в документе, разбиение на абзацы, гарнитура и размер шрифта, колонки, направление текста, цвет букв и фон текста.

Менеджер лицензий - приложение, в котором осуществляется управление лицензиями и активация ABBYY FineReader 7.0 Corporate Edition.

Моноширинный шрифт - любой шрифт, буквы которого имеют одинаковую ширину (моно). Например, шрифт Courier New. Для улучшения качества распознавания моноширинных шрифтов на закладке Распознавание в пункте Тип печати установите переключатель в положение Пишущая машинка.

Мягкий перенос - перенос (¬) показывает, в каком именно месте должно быть разорвано слово или словосочетание (например, "Автоформат"), если оно попадает на конец строки (например, "Авто-формат"). Все переносы в словарных словах FineReader заменяет на мягкий перенос.

Н

Начертание шрифта - способ выделения в тексте (полужирный, наклонный, с подчеркиванием, перечеркнутый, верхний индекс, нижний индекс, малые прописные).

Начальная форма - форма, в которой слова даются в словаре. Для существительных это форма именительного падежа единственного числа; для прилагательных - форма мужского рода единственного числа именительного падежа; для глаголов, причастий и деепричастий - это неопределенная форма (инфинитив).

О

Обучение - создание пар "растровое изображение - название символа".

Омнифонтовая система - система распознавания, которая распознает символы практически любых размеров и начертаний.

Очистка изображения - удаление отдельных мелких черных точек на изображении.

П

К началу

Пакет — это папка, в которой хранятся изображения и рабочие файлы программы. В пакете может содержаться до 9999 страниц. В один пакет для удобства работы рекомендуется объединять изображения, логически связанные между собой (например, страницы одной книги, тексты на одном языке или изображения с однотипным расположением текста и т.д.).

Парадигма - совокупность всех грамматических форм слова.

Префиксы - небуквенные символы, которые могут встречаться в абсолютном начале слова.

Принцип одной кнопки - принцип, когда при нажатии на одну кнопку (Scan&Read) система сканирует и распознает документ.

Р

К началу

Разделители - символы, которые могут разделять слова, например, /, \, тире и т.п. и которые пишутся отдельно от слов.

Разрешение - параметр сканирования, показывает кол-во точек на единицу длины. 300 dpi (размер шрифта 10 и более пунктов), 400-600 dpi для текстов, набранных мелким шрифтом (9 и менее пунктов).

С

Сканер - устройство, предназначенное для ввода изображений в компьютер.

Сложное слово - слово, отсутствующее в словаре, но которое может быть образовано из имеющихся в словаре слов.

Суффиксы - небуквенные символы, которые могут встречаться в абсолютном конце слова.

К началу

Т

Табличный блок - этот блок используется для обозначения таблиц или текста, имеющего табличную структуру. При распознавании программа разбивает данный блок на строки и столбцы и формирует табличную структуру. В выходном тексте данный блок передается таблицей. Вы можете выделить и отредактировать таблицу вручную.

Текстовый блок - блок используется для обозначения текста. Он должен содержать только одноколоночный текст. Если внутри текста содержатся картинки, выделите их в отдельные блоки.

Тип изображения - параметр сканирования; изображение может быть черно-белым, серым или цветным.

Тип (печати) входного текста - особенность в начертании символов входного текста, в зависимости от того, каким образом он напечатан (в типографии, на матричном принтере в черновом режиме, на пишущей машинке). Для типографского текста следует устанавливать режим Авто, для машинописного - режим Пишущая машинка, для текста, напечатанного на матричном принтере в черновом режиме - режим матричный принтер.

Тип блока - блок может быть Зоной распознавания, Текстовым, Картинкой, Таблицей, Штрих-кодом.

Ф

Фоновое распознавание - режим, позволяющий одновременно с распознаванием редактировать и сохранять распознанные страницы.

Ш

Шаблон блоков - в шаблоне описано положение и размеры блоков на странице.

Э

Эталон — набор пар "усредненное точечное изображение символа - его название", который создается в процессе обучения системы на конкретном тексте.

Я

Яркость - параметр сканирования, определяет контрастность, т.е. различие между черными и белыми участками текста. При правильной настройке яркости качество распознавания увеличивается.