XIX Открытая конференция студентов-филологов в СПбГУ

К вопросу об автоматическом переводе c английского на русский и с русского на английский языки неоднозначных слов (на примере ЭТАП-3 и Google Translation)

Александра Сергеевна Соколова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет

129
2016-04-19
14:00 - 14:20

Ключевые слова, аннотация

В докладе рассматривается вопрос корректного перевода неоднозначных слов на примере двух систем автоматического перевода: ЭТАП-3 и Google Traslation. В настоящее время существует несколько методов снятия лексической неоднозначности слов. Одним из таких методов является алгоритм Леска. В данной работе мы проанализировали, как данные системы переводят неоднозначные слова и какой из методов снятия лексической неоднозначности более эффективен для автоматического перевода.

Тезисы

1. В настоящее время существуют три вида систем машинного перевода:
  • системы на основе грамматических правил (Rule-Based Machine Translation);
  • статистические системы (Statistical Machine Translation);
  • гибридные системы.
2. Одним из существенных недостатков всех типов систем автоматического перевода является некорректный перевод неоднозначных слов с одного языка на другой. К сожалению, автомат не всегда может выбрать нужный вариант перевода из имеющихся у него в памяти. Для решения данной задачи существует несколько методов снятия лексической неоднозначности. Одним из самых первых методов является алгоритм Леска.
3. В данной работе на примере двух систем: ЭТАП-3 и Google Translation, — мы проанализировали,  как данные системы переводят неоднозначные слова и какой метод снятия лексической неоднозначности более эффективен для автоматического перевода. Для примера приведем перевод английского глагола put, который имеет 15 значений (
класть, ставить, помещать, приводить в какое-то состояние, вызывать или осуществлять, вкладывать, подвергать, оказывать, выражать, придавать или возлагать, вкладывать или помещать, оценивать, спрашивать, записывать или печатать, толкать ядро). Системы перевели 15 значений следующим образом:
  • ЭТАП-3: (EN->RU RU->EN): поставить — deliver, помещать — deliver, помещать — give, make, be, помещать — bring, succeed, помещать — put, bring, помещать — insert, помещать — subject, commit, поместить — exercise, помещать — express, поместить или возлагать — knock down, give, помещать — put, помещать — estimate, задавать — ask, не дал никакого перевода — specify;
  • Google Translation (EN->RU RU->EN): положить — put, положить — put, помещать, поставить — give, be jailed, положить, поставить — bring, manage, положить, вводить — put, introduce, положить, класть — put, поставить, предавать — subject, put, оказать — put, поставить — express, put, сваливать, поставить — try, give, положить — put, ставить — estimate, put, поставить — ask, положить — point, поставить — push.