К вопросу об автоматическом переводе c английского на русский и с русского на английский языки неоднозначных слов (на примере ЭТАП-3 и Google Translation)
Александра Сергеевна Соколова
Докладчик
магистрант 2 курса
Санкт-Петербургский государственный университет
Санкт-Петербургский государственный университет
129
2016-04-19
14:00 -
14:20
Ключевые слова, аннотация
В докладе рассматривается вопрос корректного перевода неоднозначных слов на примере двух систем автоматического перевода: ЭТАП-3 и Google Traslation. В настоящее время существует несколько методов снятия лексической неоднозначности слов. Одним из таких методов является алгоритм Леска. В данной работе мы проанализировали, как данные системы переводят неоднозначные
слова и какой из методов снятия лексической неоднозначности
более эффективен для автоматического перевода.
Тезисы
1. В настоящее время
существуют три вида систем машинного перевода:
3. В данной работе на примере двух систем: ЭТАП-3 и Google Translation, — мы проанализировали, как данные системы переводят неоднозначные слова и какой метод снятия лексической неоднозначности более эффективен для автоматического перевода. Для примера приведем перевод английского глагола put, который имеет 15 значений (класть, ставить, помещать, приводить в какое-то состояние, вызывать или осуществлять, вкладывать, подвергать, оказывать, выражать, придавать или возлагать, вкладывать или помещать, оценивать, спрашивать, записывать или печатать, толкать ядро). Системы перевели 15 значений следующим образом:
- системы на основе грамматических правил (Rule-Based Machine Translation);
- статистические системы (Statistical Machine Translation);
- гибридные системы.
3. В данной работе на примере двух систем: ЭТАП-3 и Google Translation, — мы проанализировали, как данные системы переводят неоднозначные слова и какой метод снятия лексической неоднозначности более эффективен для автоматического перевода. Для примера приведем перевод английского глагола put, который имеет 15 значений (класть, ставить, помещать, приводить в какое-то состояние, вызывать или осуществлять, вкладывать, подвергать, оказывать, выражать, придавать или возлагать, вкладывать или помещать, оценивать, спрашивать, записывать или печатать, толкать ядро). Системы перевели 15 значений следующим образом:
- ЭТАП-3: (EN->RU — RU->EN): поставить — deliver, помещать — deliver, помещать — give, make, be, помещать — bring, succeed, помещать — put, bring, помещать — insert, помещать — subject, commit, поместить — exercise, помещать — express, поместить или возлагать — knock down, give, помещать — put, помещать — estimate, задавать — ask, не дал никакого перевода — specify;
- Google Translation (EN->RU — RU->EN): положить — put, положить — put, помещать, поставить — give, be jailed, положить, поставить — bring, manage, положить, вводить — put, introduce, положить, класть — put, поставить, предавать — subject, put, оказать — put, поставить — express, put, сваливать, поставить — try, give, положить — put, ставить — estimate, put, поставить — ask, положить — point, поставить — push.