Как разработчику игр использовать машинный перевод в техпроцессе

Использовать или не использовать машинный перевод – уже не вопрос. Сегодня технологии автоматизированного перевода получили огромное распространение, ведь он позволяет уменьшить стоимость локализации и при этом ускорить ее. Казалось бы, мечта многих людей и компаний стала реальностью, но не все так просто, как нам всем хотелось бы.

Как разработчику игр использовать машинный перевод в техпроцессе

Бездумное использование машинного перевода не только не поможет вам, но и наверняка навредит, ведь по качеству он все еще существенно уступает выполненному специалистом. Основная проблема состоит в том, что программа не всегда может распознать контекст фразы и перевести термины не дословно, к тому же не отличает имен собственных от нарицательных. Все мы видели примеры таких досадных оплошностей:

Как же избежать такого результата? Ответ прост: применять машинный перевод с учетом его особенностей.

Так, например, нельзя доверять машине тексты, где при любой неточности перевода мы рискуем искажением правовой информации, исправностью механизма и, конечно, нанесением урона здоровью человека. Получается, что медицинские, юридические и технические тексты перевести таким способом не получится. Маркетинговые материалы также не годятся в качестве предмета машинного перевода, ведь в процессе локализации их нужно полностью переосмысливать и адаптировать к культуре другой страны. То же самое относится и к рекламным текстам и художественной литературе (а значит, и игровым текстам): чтобы довести качество машинного перевода до уровня человеческого, редактору придётся переписывать его практически с нуля, что не только нивелирует экономию, но и увеличит время обработки текста.

Кроме постредактирования машинного перевода существует так называемое предредактирование исходного текста, то есть переработка его структуры таким образом, чтобы получить машинный перевод наиболее высокого качества. Например, если оригинал составлен на английском языке, рекомендуется:

  • заменить герундий личными глаголами, а глаголы в пассивном залоге — глаголами активного залога;
  • отказаться от использования сложных предложений и однородных членов;
  • перестроить текст так, чтобы каждое предложение содержало одну законченную мысль.

Согласитесь, работа предстоит внушительная – и не слишком похожая на привычное редактирование. Кроме того, если вы захотите сэкономить на этом этапе и выполнить его самостоятельно или при помощи знакомого, скорее всего, придется ограничиться русским и английским языками. А для переработки текста на китайском или тайском все же нужно будет искать носителя языка, да еще и объяснять ему, чего вы от него хотите. Кстати, по нашему опыту, если это будет профессиональный переводчик, шанс, что он возьмется за такую нестандартную работу по низкой ставке, тоже очень и очень низок 😊

Получается, что полный машинный перевод текста опасен и невыгоден независимо от его тематики. Даже если он будет отредактирован человеком – перед переводом или после. Именно поэтому мы предлагаем использовать машинный перевод только частично: для коротких и желательно однозначных фраз.

Мы считаем, что самый оптимальный способ применения машинного перевода — это частичный перевод текстов с обязательной последующей двуязычной редактурой. Эффективнее всего использовать в качестве инструмента специальный плагин в CAT-программе: он «обучается» в процессе перевода и настраивается на перевод текстов той ли иной тематики. И да, конечно, нужно подключить глоссарий проекта и отраслевые словари. Таким образом мы получаем наиболее качественный подстрочник, который затем доводится до ума специалистом.

Вот как это выглядит:

На небе только и разговоров, что о море и о закате. Там говорят о том, как чертовски здорово наблюдать за огромным огненным шаром, как он тает в волнах.
На небе только и разговоров, что о море и о закате. Там говорят о том, как чертовски здорово наблюдать за огромным огненным шаром, как он тает в волнах.

Кстати, как вы думаете, в каких языковых парах лучше всего применять машинный перевод? Ведь каждый язык обладает собственными синтаксическими особенностями, накладывающими ограничения на использование этой технологии.

По нашему опыту, машинный перевод лучше всего «работает» с английского на европейские языки и с русского на английский. Именно в этих языковых парах он получается более-менее приемлемого качества и пригоден для дальнейшей редактуры. А вот азиатские языки в силу их природы в качестве предмета машинного перевода можно даже не рассматривать.

Как разработчику игр использовать машинный перевод в техпроцессе

Итак, каким должен быть текст, чтобы его можно было предперевести машинно?

В первую очередь, он должен быть фразой. Потому что, как уже упоминалось выше, машинный перевод все еще не справляется с целыми текстами. В свою очередь фраза должна быть:

  • короткой – в идеале до 3 слов. Мы пришли к этому путем бесконечных экспериментов и ручаемся за свои слова;
  • однозначной — без использования полисемичных слов. Но если у вас нет времени на полноценный предпереводческий анализ, не переживайте: постредактирование позволит исправить возможные ошибки вроде таких:
Как разработчику игр использовать машинный перевод в техпроцессе

Если мы говорим об игровых текстах, то это могут быть:

  • интерфейсные фразы (Exit, Are you sure?);
  • короткие и однозначные фразы типа «Да» или «Нет»;
  • названия внутриигровых предметов и валюты – при условии последующей сверки получившегося перевода с изображением;
  • фразы с глоссарными терминами (так как они с легкостью подставляются CAT-программой);
  • известные имена собственные (Great Britain, Москва, Клара Цеткин);
  • фразы с названиями дней недели, месяцев и т. п.

Что касается языковых пар, лучше всего поддаются машинному переводу тексты на английском (при локализации на европейские языки) и на русском (при локализации на английский язык).

Надеемся, что наш опыт поможет вам грамотно применять технологии машинного перевода в вашем процессе локализации.

Текст подготовила Ксения Меженина — директор по производству услуг локализации Allcorrect Group.

1.4K1.4K открытий
21 комментарий

Как это низко, ставить симпатичную девушку на превьюшку статьи, чтобы ее прочитало больше людей.
А так статься хорошая.

Ответить

Меня больше смутила сама картинка и заголовок. Как-будто в тексте будет список преимуществ, а в конце предложение купить программу для перевода. Я чуть рефлекторно не репортнул даже.

Ответить

Все нормально, симпатичная девушка - автор статьи:)

Ответить
Комментарий удалён модератором

симпатичную...

Ответить

Кстати, автору статьи на заметку: англо-украинская пара работает очень плохо, поэтому обычно используют англо-русскую, а затем русско-украинскую. Это из личного опыта. Хотя такой двойной перевод сразу виден, потому что нативный перевод в англо-украинской паре будет отличаться по построению оборотов.
И по поводу САТ-систем: какую кошку вы используете? Мне все интересно, где-нибудь вообще используется SDL Passolo?

Ответить

Интересный момент, спасибо!
Сейчас мы в основном работаем с memoQ.

Ответить