Тел: +7 (843) 214-75-00

Казань, Щербаковский пер., 7

2147500@gmail.com

Пн-Пт 800-2000, Сб-Вс 930-2000


Онлайн-перевод разрушает языковые барьеры

24 Января 2013

Google и другие сервисы бесплатного перевода позволяют пользователям прочитать на любом языке, при этом качество перевода варьируется от выразительного до невразумительного.

По материалам Deutsche Welle.

Франц Йозеф Ох: машинный перевод Google Translate использует статистический метод

Интернет объединяет мир, однако большинство людей разделены языковым барьером. Поэтому такие машинные переводчики, как Google Translate, Bing компании Microsoft и Systran, являются большой находкой.

По данным Франца Джозефа Оха, главы группы машинного перевода Google, одним только сервисом Google Translate ежемесячно пользуется более 200 миллионов человек в мире.

«Сегодня большую часть перевода на планете выполняет Google Translate»- написал он в блоге компании ранее в этом году.

Но все же Ох не испытывает иллюзий относительно сложностей создания читаемого машинного перевода. Он уверен в том, что предстоит сделать много работы: «Если веб-страница на французском, а вы не владеете им, то машинный перевод не так приятен на слух, как работа переводчика, однако он позволит вам понять смысл написанного»- рассказал он DW.

Все дело в вероятности

Google Translate берет существующие рукотворные переводы из сети и использует статистические алгоритмы для вычисления наиболее вероятного совпадения между двумя текстами в данной языковой паре.

Этот метод основан на прорывной технологии машинного перевода, разработанной физиками IBM в 90-х. Конкурент Google, поисковик Bing компании Microsoft, использует аналогичный метод.

Хорошим примером работы Google и Bing является перевод немецкого рождественского поздравления: «Wir wünschen Euch ein frohes Weihnachtsfest und einen guten Rutsch ins neue Jahr!»

Google и Bing выдают: «Мы желаем вам счастливого Рождества и Нового года!». А Systran, один из основных мировых машинных переводчиков, выдает неуклюжий перевод: «Мы желаем вам радостного Рождества и хорошего скольжения в Новом году!»

Результат Google и Bing наиболее вероятный, так как он является лучшим совпадением из баз данных этих поисковых систем.

По мнению Алёши Бурхардт, эксперту по вопросам машинного перевода из берлинского «Немецкого исследовательского центра по искусственному интеллекту» (DFKI), одним из преимуществ машинного перевода, основанного на лингвистических правилах, является большие возможности пользователей влиять на результат.

«Вы знаете, что делает система, основанная на правилах, но для работы в новой предметной области вам необходимы эксперты для освоения нового лексикона и нового способа построения предложений»- рассказал он DW. Но это не проблема для вероятностных систем, таких как Google или Bing.

«В определенных предметных областях удаётся получить хорошие результаты, как например в парламентских дебатах, где тонны текста, переведенного профессионалами ЕС и ООН существуют во многих языковых комбинациях»- сказал Бурхардт.

Проблема с Google Translate

Бурхардт заметил, что качество результата, выдаваемого Google, резко снижается в тех областях, где недостаточно переведённых текстов, доступных для параллельного сравнения, например в зоологии или охоте.

Но еще более усугубляет ситуацию то, что существует много неоднозначных слов, которые имеют двойное или тройное значение и в значительной степени зависят от контекста. Примером является английское слово "bank". Говоря "savings bank" мы имеем в виду "сберегательный банк", а "river bank" – это берег реки. Но при переводе предложения из охотничьей тематики "The ducks emerged from the river and the hunter could see them by the bank" пользователь пока ещё не может быть уверен (игра слов: "bank on" – "полагаться на" (анг.)), что Google переведёт "bank" именно как "берег".

Статистический машинный перевод зависит от миллиардов переведенных предложений и поиска параллельных совпадений в них за долю секунды. ООН и ЕС являются главными источниками профессиональных переводов. Однако в сети существует множество слабых человеческих и машинных переводов и давать оценку надёжности перевода компьютер не в состоянии.

В дополнение к этому, Google не различает рукотворный перевод и перевод, сделанный им самим же ранее.

«Множество людей выкладывают в сеть перевод сделанный через Google Translate. Как результат, наша система «учится» сама у себя, чего нам очевидно не хотелось бы»- сказал Ох.

Его команда работает над алгоритмами, исключающими плохие машинные переводы.

Google также работает над улучшением качества переводов с помощью пользователей, которые, как правило, переводят текст на свой родной язык. Новая функция просит их выбрать лучший перевод из двух или более вариантов.

«Хорошо, что люди обладают здравым смыслом, что помогает им пользоваться Google Translate. Ведь если даже он сформулирует что-то странное, то вы вполне можете понять о чем идет речь»- сказал Ох.

Перевод выполнил Александр Сидоров

Вам тоже нужна работа переводчиком в Казани?

Возврат к списку


Онлайн-заказ и расчет стоимости

Заполните форму и администратор свяжется с вами по e-mail для подтверждения заказа услуги. Вы можете приложить файл для предварительного расчета стоимости перевода.

Перетащите файл сюда
Выбрать

НА