Проверьте, чтобы на закладке Распознать (меню
Сервис>Опции) в группе Распознавание с обучением
переключатель был установлен в положение Распознавание с
обучением.
Нажмите кнопку 2-Распознать. Программа начнет
распознавание. Как только встретится символ, подлежащий обучению,
откроется диалог Ручное
обучение эталона с изображением этого символа.
Обучение
символу
Описывающий прямоугольник в верхней части диалога должен
содержать один целый символ. Если он содержит часть буквы
или более одной буквы, то с помощью мыши или кнопок и
прямоугольник можно передвинуть так, чтобы он
охватывал одну целую букву.
Далее введите нужный символ и нажмите кнопку Обучить.
Внимание!
Обучение озможно только для символов, входящим в алфавит языка.
Если вы обучаете программу символам, которые нельзя ввести с
клавиатуры, то для их обозначения можно использовать комбинацию из
двух символов, или вы можете скопировать требуемый символ из
Таблицы символов (открывается при нажатии в диалоге Ручное обучение
эталона кнопки ).
Если в обучаемом тексте встречаются слова, набранные
курсивом или полужирным, и вам важно сохранить
гарнитуру шрифта в распознанном тексте, то при обучении таким
символам в диалоге Ручное обучение эталона
следует отметить пункты Курсив или Полужирный
соответственно.
При обучении следите за тем, чтобы изображениям заглавных букв
соответствовали заглавные буквы, а изображениям строчных букв –
строчные.
Если в процессе обучения вы ошиблись, то можно нажать кнопку
Вернуться, и охватывающий прямоугольник вернется на
предыдущую позицию, а последняя обученная пара "изображение –
символ" будет удалена из эталона. Кнопка Вернуться действует
в пределах одного слова.
Обучение лигатурам
Лигатуры - это сочетания двух или трех символов, которые из-за
особенностей их начертания невозможно разделить при обучении и
которым поэтому сразу обучаются как комбинации символов. Обучение
лигатурам происходит так же, как и обучение отдельным символам:
В строке для ввода символа введите нужное сочетание символов и
нажмите кнопку Обучить.
Описывающий прямоугольник в верхней части диалога должен
содержать сочетание целиком. Передвинуть прямоугольник можно
с помощью мыши или используя кнопки и
.
В одном эталоне может содержаться до 1000 новых символов. Однако
не следует создавать слишком много лигатур, т.к. это может
отрицательно сказаться на качестве распознавания.
При обучении необходимо учесть следующие ограничения:
Изображения некоторых символов не различаются системой
распознавания и сопоставляются с каким-то одним символом. Например,
прямой ('), левый (‘) и правый (’) апострофы хранятся в эталоне как
изображение прямого апострофа. Таким образом, в результате
распознавания в тексте никогда не появится правый или левый
апостроф, хотя при обучении были указаны именно эти
символы.
Для некоторых изображений решение о том, какому символу в
распознанном тексте сопоставить встретившееся конкретное
изображение, принимается на основе общего анализа распознанного
текста. Так, например, решение о том, является ли символ,
обозначаемый "кружком", буквой о или цифрой ноль, система принимает
в зависимости от того, находятся ли рядом другие цифры или
буквы.