Подготовка исходного текста

Качество машинного перевода непосредственно зависит от качества поставляемого исходного текста.

Чтобы получить хорошие результаты машинного перевода, документы должны быть написаны ясным, четким, правильным языком. Создание хорошего текста для машинного перевода идентично созданию текста, который человек может читать легко без дополнительных усилий.

Избегайте идиоматических выражений!
Если вы не уверены, что данная фраза является идиомой, рассмотрите буквальное (литературное) значение слов. Если буквальный смысл не ясен, пробуйте выразить ту же самую мысль другим способом.

Избегайте опечаток и орфографических ошибок!
Машинный переводчик не умеет исправлять ошибки и распознавать неправильно написанные слова (здесь могут оказаться полезными специальные программы проверки орфографии).

Помните про знаки препинания!
Пропущенный или, наоборот, избыточный знак препинания может помешать электронному переводчику правильно понять синтаксическую структуру предложения.

Старайтесь избегать пропуска служебных слов (даже если это разрешено грамматикой).
Программа не может читать "между строк". Она может перевести только то, что написано, а не то, что автор имел в виду. Не пропускайте служебные слова или выражения. Даже если это разрешено грамматикой входного языка, они могут понадобиться для формирования структуры предложения на выходном языке.

Создавайте ясные, простые и законченные предложения.
Разбивайте длинные предложения, выражающие несколько мыслей, на несколько более коротких, выражающих одну главную мысль. Избегайте многословности и сложных  конструкций с придаточными предложениями, но не пропускайте необходимых  грамматических  элементов. Избегайте неоднозначности, например, в использовании предлогов или союзов. Избегайте неясных ссылок, например, в местоимениях; ссылайтесь только на то, что является явно опознаваемым. Неясный вход оставляет место для неправильного трактования программой. Чем более ясной является информация  в предложениях, тем лучший перевод вы получите.

Правильно расставляйте знаки диакритики!
Некоторые знаки диакритики очень похожи (например, è и é); убедитесь, что введен правильный. Если вы используете сканнер и программу распознавания текста (OCR) для ввода иностранного текста, рекомендуется использовать OCR программу, которая распознает такие иностранные символы, как ä, ñ, ê и í.

Соблюдайте регистр букв!
Маленькая буква в слове вполне может стать большой (например, в начале предложения, в заголовке), и это учитывается при разработке систем машинного перевода. Большая же буква, напротив, маленькой становится редко, причем в большинстве случаев это связано с образованием нового слова, например, при переходе собственного имени в разряд имен нарицательных — плюшкин, тартюф, ксерокс...).

К тому же, существуют языки, где первая большая буква в слове принципиально меняет принадлежность этого слова к той или иной части речи. Примером является, безусловно, немецкий язык, в котором существительные пишутся с большой буквы как в начале, так и в середине предложения.

Пишите документы стандартным, формальным языком.
Формальный (официальный) язык характеризуется тем, что грамматические связи выражены явно: объекты согласуются с предикатами, модификаторы относятся к тому, что они модифицируют. Необязательные слова сведены к минимуму. Ясное, формальное письмо, наиболее простое для понимания читателем, будет переведено максимально точно. Неформальный язык, отличающийся свободным грамматическим стилем, вполне приемлем для разговорной речи, но не всегда подходит для перевода. Избегайте жаргонных выражений!

Старайтесь использовать простые синтаксические конструкции с прямым порядком слов.
Существует целый ряд рекомендаций, как сделать текст на естественном языке более "удобоваримым" для машины. Например, на первом месте должно идти подлежащее или его группа. На втором месте сказуемое, выраженное глаголом. Дальше идут обстоятельства, выраженные разными частями речи.

Используйте только общепринятые сокращения!
Неправильный перевод сокращения — это только половина проблемы. Неприятные последствия может иметь тот факт, что некоторые аббревиатуры совпадают по написанию с часто используемыми словами.