Обучение эталона

  1. Проверьте, чтобы на закладке Распознать (меню Сервис>Опции) в группе Распознавание с обучением переключатель был установлен в положение Распознавание с обучением.
  2. Нажмите кнопку 2-Распознать. Программа начнет распознавание. Как только встретится символ, подлежащий обучению, откроется диалог Ручное обучение эталона с изображением этого символа.

Обучение символу

Описывающий прямоугольник в верхней части диалога должен содержать один целый символ. Если он содержит часть буквы или более одной буквы, то с помощью мыши или кнопок и прямоугольник можно передвинуть так, чтобы он охватывал одну целую букву.

Далее введите нужный символ и нажмите кнопку Обучить.

Внимание!

  1. Обучение озможно только для символов, входящим в алфавит языка. Если вы обучаете программу символам, которые нельзя ввести с клавиатуры, то для их обозначения можно использовать комбинацию из двух символов, или вы можете скопировать требуемый символ из Таблицы символов (открывается при нажатии в диалоге Ручное обучение эталона кнопки ).
  2. Если в обучаемом тексте встречаются слова, набранные курсивом или полужирным, и вам важно сохранить гарнитуру шрифта в распознанном тексте, то при обучении таким символам в диалоге Ручное обучение эталона следует отметить пункты Курсив или Полужирный соответственно.
  3. При обучении следите за тем, чтобы изображениям заглавных букв соответствовали заглавные буквы, а изображениям строчных букв – строчные.

Если в процессе обучения вы ошиблись, то можно нажать кнопку Вернуться, и охватывающий прямоугольник вернется на предыдущую позицию, а последняя обученная пара "изображение – символ" будет удалена из эталона. Кнопка Вернуться действует в пределах одного слова.

Обучение лигатурам

Лигатуры - это сочетания двух или трех символов, которые из-за особенностей их начертания невозможно разделить при обучении и которым поэтому сразу обучаются как комбинации символов. Обучение лигатурам происходит так же, как и обучение отдельным символам:

  1. В строке для ввода символа введите нужное сочетание символов и нажмите кнопку Обучить.
  2. Описывающий прямоугольник в верхней части диалога должен содержать сочетание целиком. Передвинуть прямоугольник можно с помощью мыши или используя кнопки и .

В одном эталоне может содержаться до 1000 новых символов. Однако не следует создавать слишком много лигатур, т.к. это может отрицательно сказаться на качестве распознавания.

При обучении необходимо учесть следующие ограничения:

  1. Изображения некоторых символов не различаются системой распознавания и сопоставляются с каким-то одним символом. Например, прямой ('), левый (‘) и правый (’) апострофы хранятся в эталоне как изображение прямого апострофа. Таким образом, в результате распознавания в тексте никогда не появится правый или левый апостроф, хотя при обучении были указаны  именно эти символы.
  2. Для некоторых изображений решение о том, какому символу в распознанном тексте сопоставить встретившееся конкретное изображение, принимается на основе общего анализа распознанного текста. Так, например, решение о том, является ли символ, обозначаемый "кружком", буквой о или цифрой ноль, система принимает в зависимости от того, находятся ли рядом другие цифры или буквы.