Глоссарий расширенного формата – это текстовый файл, который кроме основной информации, необходимой для создания словарных статей (ключ и перевод), содержит также дополнительную информацию, задающую лингвистические параметры создаваемых словарных статей
Правила создания глоссария расширенного формата:
#format=1.0
Если строка, описывающая версию формата, отсутствует, то при обработке считается, что глоссарий имеет простой формат.
Обязательным для глоссария расширенного формата являются только поля Key и Translation, остальные поля могут отсутствовать в глоссарии.
- При обработке глоссария учитываются только значащие строки, т.е. строки, содержащие информацию о словарной статье, которую необходимо ввести в словарь. Комментарии (комментарии начинаются с символа решетки # и продолжаются до конца строки), пустые строки и строки, состоящие только из пробелов, при обработке глоссария игнорируются.
- Значащие строки разделяются на поля символом табуляции. Количество и порядок следования полей в значащих строках должны строго соответствовать количеству и порядку полей, перечисленных во второй строке глоссария.
- Ведущие и заключительные пробелы в полях игнорируются, сдвоенные пробелы рассматриваются как одиночный пробел. Допускается опускать символы табуляции, отделяющие последние поля, если они не содержат значений.
- В случае, когда для ключа статьи необходимо указать более одного перевода, каждый следующий перевод следует переносить на новую строку, при этом поле Key должно быть оставлено пустым (может содержать пробелы). Для каждого перевода можно назначить отдельные значения OutProp и OutComment. Значения полей PartOfSpeech и InProp в строке с дополнительным переводом игнорируются; эти данные для дополнительного перевода извлекаются из первой строки статьи (содержащей ключ).
Значения некоторых полей файла глоссария расширенного формата (например, PartOfSpeech, InProp и OutProp) предопределены (см.: Предопределенные значения полей глоссария ).
См. также:
Пример глоссария расширенного формата