Home Машинное обучение Amazon Translate совершенствует собственную терминологию, чтобы повысить точность и беглость перевода | DeepTech

Amazon Translate совершенствует собственную терминологию, чтобы повысить точность и беглость перевода | DeepTech

0
Amazon Translate совершенствует собственную терминологию, чтобы повысить точность и беглость перевода
 | DeepTech

Amazon Translate – это сервис нейронного машинного перевода, который обеспечивает быстрый, качественный, доступный и настраиваемый языковой перевод. Когда вы переводите с одного языка на другой, вы хотите, чтобы ваш машинный перевод был точным, беглым и, самое главное, контекстно-зависимым. Настраиваемая терминология, зависящая от домена и языка, является ключевым требованием для многих государственных и коммерческих организаций.

Пользовательская терминология позволяет настраивать выходные данные перевода таким образом, чтобы словарь вашего домена и организации, такой как названия брендов, имена персонажей, названия моделей и другое уникальное содержимое (именованные объекты), переводился именно так, как вам нужно. Чтобы использовать функцию настраиваемой терминологии, необходимо создать файл терминологии (файл в формате CSV или TMX) и указать пользовательскую терминологию в качестве параметра в запросе на перевод Amazon Translate в режиме реального времени или асинхронной пакетной обработке. См. статью Настройка выходных данных Amazon Translate в соответствии со словарем вашего домена и организации, чтобы начать работу с настраиваемой терминологией.

В этом посте мы рассмотрим ключевые усовершенствования пользовательской терминологии, которая не просто выполняет простое сопоставление и замену, но добавляет контекстно-зависимое сопоставление и замену, что сохраняет конструкцию предложения. Это усовершенствование направлено на создание контекстно-подходящих версий соответствующих целевых терминов для создания переводов более высокого качества и беглости.

Обзор решения

Мы используем следующую пользовательскую терминологию файл для изучения расширенных функций пользовательской терминологии. Инструкции по созданию пользовательской терминологии см. в разделе Настройка выходных данных Amazon Translate в соответствии со словарем вашего домена и организации.

en фр эс
репетитор педагог репетитор
овца агно Овеха
гулять пешком выдающийся пара кеминар
бургер бутерброд гамбургский
специфический для действия конкретное действие специальное действие
заказ команда команда

Изучение функции пользовательской терминологии

Давайте переведем предложение «она была отличным репетитором» с помощью Amazon Translate. Выполните следующие шаги:

  1. В консоли Amazon Translate выберите Перевод в реальном времени в панели навигации.
  2. Выбрать Текст вкладка
  3. Для Язык переводавыбирать Французский.
  4. Введите текст «она была отличным наставником».

Как показано на следующем снимке экрана, перевод на французский язык звучит как «elle était une perfecte tutrice».

  1. Под Дополнительные настройкивыбирать Пользовательская терминология и выберите свой собственный файл терминологии.

Французский перевод изменен на «elle était une perfecte éducatrice».

В пользовательском файле терминологии мы указали перевод для «tutor» как «éducateur». «Educateur» во французском языке мужского рода, а «tutor» в английском — гендерно-нейтрального. Пользовательская терминология не выполняла сопоставление и замену здесь, вместо этого использовалось целевое слово и применялся правильный род в зависимости от контекста.

Теперь давайте проверим функцию с исходным предложением «у него 10 овец». Перевод на французский язык звучит как «il a 10 agneaux». Мы предоставили специальную терминологию для «овец» как «agneau». «Agneau» по-французски означает «овечка» и стоит в единственном числе. В этом случае целевое слово изменяется на склонение множественного числа.

Исходное предложение «вечерние прогулки драгоценны для меня» переводится как «me promener le soir est précieux pour moi». Целевое слово пользовательской терминологии «променант» изменено на «променер», чтобы изменить правильное время глагола.

Исходное предложение «I like burger» будет переведено как «J’aime les sands» для изменения правильного существительного в зависимости от контекста.

Теперь давайте проверим предложения с целевым языком как испанским.

Исходное предложение «любые параметры, относящиеся к действию, перечислены в теме для этого действия» переводится как «odos los parametros especificos de acción aparecen en el tema de esa acción» для изменения правильного прилагательного.

Исходное предложение «чтобы мы могли вам помочь, пожалуйста, назовите свое имя» будет переведено как «pour que nous puissions vous aider, veuillez partager votre nom».

Некоторые слова могут иметь совершенно разные значения в зависимости от контекста. Например, слово «заказ» в английском языке может быть последовательностью (как в исходном предложении) или командой или инструкцией (как в «Я заказываю книги»). Без явной информации трудно понять, какое значение имеется в виду. В этом случае «приказ» не следует переводить как «commande», потому что по-французски это означает «командовать» или «инструктировать».

Заключение

Функция пользовательской терминологии в Amazon Translate может помочь вам настроить переводы на основе вашего домена или языковых конструкций. Недавние усовершенствования функции пользовательской терминологии создают контекстно-подходящие версии совпадающих терминов для создания переводов более высокого качества. Это усовершенствование повышает точность и беглость перевода. Для использования расширенной функции существующим клиентам не требуется никаких изменений.

Для получения дополнительной информации об Amazon Translate посетите ресурсы Amazon Translate, чтобы найти видеоресурсы и записи в блогах, а также ознакомьтесь с ответами на часто задаваемые вопросы по AWS Translate.


Об авторах

Сатья Балакришнан — старший консультант группы профессиональных услуг в AWS, специализирующийся на решениях для данных и машинного обучения. Он работает с федеральными финансовыми клиентами США. Он увлечен созданием прагматичных решений для решения бизнес-проблем клиентов. В свободное время он любит смотреть фильмы и ходить в походы со своей семьей.

Сид Падгаонкар — старший менеджер по продукту Amazon Translate, службы обработки естественного языка AWS. По выходным вы найдете его играющим в сквош и исследующим гастрономическую сцену Тихоокеанского Северо-Запада.

LEAVE A REPLY

Please enter your comment!
Please enter your name here