Глоссарий простого формата

Глоссарий простого формата может использоваться для ввода статей в пользовательский словарь в интерактивном режиме, в котором для каждой статьи из глоссария необходимо вручную задавать грамматическую информацию, а также для создания словаря в автоматическом режиме с использованием технологии Automated Dictionary Construction.

Глоссарий простого формата содержит только две колонки – ключ (входное слово или словосочетание) и перевод.

Правила обработки глоссария простого формата:

  1. При обработке глоссария учитываются только значащие строки, т.е. строки, содержащие информацию о словарной статье, которую необходимо ввести в словарь. Комментарии (комментарии начинаются с символа решетки # и продолжаются до конца строки), пустые строки и строки, состоящие только из пробелов, при обработке глоссария игнорируются.
  2. Каждая значащая строка файла соответствует одной словарной статье и должна содержать входное слово (словосочетание) и хотя бы один перевод. Входное слово отделяется от переводов одним или несколькими символами табуляции, или не менее, чем двумя символами пробела.
  3. Если для входного слова задается несколько переводов, то они разделяются между собой точкой с запятой (;).
  4. Ведущие пробелы во входном слове (словосочетании), ведущие и заключительные пробелы в переводах игнорируются, сдвоенные символы пробела в переводах рассматриваются как одиночный пробел.

Наличие сдвоенных символов пробела и знаков табуляции во входном словосочетании недопустимо, так как это рассматривается как разделитель входного слова (словосочетания) и перевода.

См. также:

Пример глоссария простого формата