Может ли машинный перевод конкурировать с профессиональным? Да — и в некоторых областях уже это делает. Онлайн-переводчики позволяют разобраться в материале на незнакомом языке за считаные минуты, и не всегда заметно, что перевод сделан нейросетями. Причем материалы могут быть самыми разными — от текстов до прямых трансляций, как в Яндекс Браузере. Но еще совсем недавно такие программы подходили разве что для перевода отдельных слов и выражений, а не больших материалов. Рассказываем, как развивался машинный перевод.

1930-е годы: первые эксперименты

Хотя машинный перевод ассоциируется прежде всего с интернет-сервисами, первые наработки в этой области появились задолго до изобретения всемирной паутины. В 1933 году во Франции и Советском Союзе инженеры независимо друг от друга предложили 2 вида устройств для перевода.

Франция: «механический мозг»

Первое устройство называлось «механическим мозгом». Его разработал французский инженер армянского происхождения Жорж Арцруни. Как отмечает Джон Хатчинс, британский лингвист и специалист в области машинного перевода, «механический мозг», в отличие от других подобных изобретений того периода, был предназначен не для ускорения вычислений, а для хранения и последующего извлечения информации. Иными словами, он обладал своего рода памятью, данные из которой можно было напечатать.

Так выглядел «механический мозг». Источник иллю...

Так выглядел «механический мозг». Источник иллюстрации: Two precursors of machine translation: Artsrouni and Trojanskij

Сам Арцруни предлагал использовать изобретение для:

  • составления телефонных справочников и расписания поездов;

  • работы с банковскими документами;

  • генерации телеграфных кодов;

  • расшифровки и шифрования сообщений;

  • переводов с одного языка на другой.

Последнюю функцию инженер выделял особо. В описании своего устройства он отмечал: «мозг» можно использовать для «перевода с одного иностранного языка на любой другой из трех, записанных в нем… Даже если существующая модель работает только на четырех языках, [потенциально] количество языков и количество слов для каждого из них может быть неограниченным».

В изобретении было 4 основных компонента. Первый — собственно «память», куда заносились слова на четырех языках. Второй — механизм ввода. Последние два элемента — механизм поиска (селектор) и механизм вывода. Как это работало?

Хатчинс рассказывает, что перевод проходил в четыре этапа:

  1. Вводилось слово для перевода, что активировало считывающую головку.

  2. Одновременно приводились в движение ленты механизма поиска и «памяти».

  3. Движение прекращалось, когда перфорация на ленте селектора совпадала с перфорацией на ленте «памяти».

  4. Оператор считывал результаты перевода.

Арцруни представил свое изобретение на Всемирной выставке в Париже в 1937 году. Некоторые государственные организации Франции — например, Министерство обороны и почтовая служба — заключили с инженером контракты на разработку устройств под их конкретные требования. Однако во время Второй мировой войны практически все наработки и прототипы «механического мозга» были утрачены.

СССР: «машина для подбора и печатания слов при переводе с одного языка на другой»

В том же 1933 году, когда Арцруни получил патент на «механический мозг», советский ученый Петр Троянский разработал свое устройство. Он назвал его «машиной для подбора и печатания слов при переводе с одного языка на другой или на несколько других одновременно». В отличие от механизма Арцруни, изобретение Троянского предназначалось только для перевода.

Как отмечает Хатчинс, устройство было довольно простым: печатная машинка, пленочный фотоаппарат и «глоссарное поле» — пластина со словами на разных языках. Оператор находил на пластине нужное слово и фиксировал на нем ленту печатной машины. Затем он вводил код, обозначавший грамматическую категорию слова или его роль в предложении, после чего фотографировал комбинацию исходного слова и кода, которая переводилась на другой язык. Таким образом создавалась заготовка текста — последовательность слов с определенными характеристиками.

Схема машины Троянского. Источник иллюстрации: ...

Схема машины Троянского. Источник иллюстрации: Two precursors of machine translation: Artsrouni and Trojanskij

После этого в дело вступал редактор — он должен был знать язык перевода. Ориентируясь на коды, он менял форму слов и ставил их на нужные места в предложении. В результате получался связный текст.

Таким образом, Троянский создал не просто механический словарь — он показал, какой могла бы быть система полноценного машинного перевода. Но в Советском Союзе его наработки не посчитали полезными. К ним вернулись только в 1950-х годах — после Джорджтаунского эксперимента.

Конец 1940-х: Уоррен Уивер

Считается, что машинный перевод в известном нам виде зародился именно в 1940-е годы благодаря работам американского математика Уоррена Уивера. 4 марта 1947 года он отправил своему коллеге, математику и философу Норберту Винеру, письмо, где предложил применить к переводу методы криптографии. Он полагал, что перевод — это дешифровка текста оригинала:

«Полностью осознавая — хотя и смутно — семантические трудности, я задался вопросом, так ли уж немыслимо спроектировать компьютер, который будет переводить… Когда я смотрю на статью на русском языке, то говорю: „На самом деле это написано по-английски и закодировано какими-то странными символами. Теперь мне надо их расшифровать“».

У Винера это предложение энтузиазма не вызвало. Он считал, что для создания такой технологии «границы слов в разных языках слишком расплывчаты, а эмоциональные и межнациональные коннотации слишком разнообразны». Уивера, однако, мнение коллеги не остановило — он начал работать над своей идеей и в 1949 году опубликовал меморандум, который назвал «Translation» («Перевод»).

В этой публикации Уивер предложил четыре принципа, благодаря которым можно было бы выйти за рамки дословного машинного перевода:

  1. Уточнять значение слов с помощью контекста.

  2. Рассматривать язык как логическую систему и выстраивать процесс перевода на основе законов формальной логики.

  3. Рассматривать процесс перевода как процесс дешифровки и использовать инструменты криптографии.

  4. Упрощать перевод с помощью лингвистических универсалий — базовых элементов, свойственных всем естественным языкам.

Реакция на меморандум была неоднозначной. Некоторые исследователи отрицали саму идею механизации такого сложного процесса, как перевод. Но были и те, кто воспринял предложения Уивера более оптимистично. Ученые из разных областей — лингвистики, математики, логики и других — начали собственные исследования. Результатом впоследствии стал Джорджтаунский эксперимент.

1950-е годы: Джорджтаунский эксперимент и советские исследования

В 1952 году в Массачусетском технологическом университете прошла первая конференция по машинному переводу. Обсудив лингвистические и технические вопросы в этой области, ученые и инженеры пришли к выводу: уже в ближайшие годы можно провести эксперименты на опытных машинах. Первый такой эксперимент состоялся в 1954 году.

7 января 1954 года специалисты компании IBM и Джорджтаунского университета продемонстрировали возможности машинного перевода на практике. В штаб-квартире компании компьютер IBM 701 перевел более 60 предложений с русского языка на английский. Скорость перевода составила 2,5 строки в секунду. Оригинальный текст вводился в компьютер на перфокартах, а результат распечатывался на принтере.

Отметим, что принципы перевода были весьма далеки от идей дешифровки, которые предлагал Уивер. Программа учитывала шесть синтаксических правил и использовала словарь из 250 слов. Иными словами, она анализировала связи между членами предложения, а не подсчитывала сочетания элементов. Так появился RBMT (Rule-based Machine Translation) — машинный перевод на основе правил.

В середине 50-х эксперимент стал сенсацией во всем мире. Многие страны начали разрабатывать свои системы машинного перевода, и прежде всего Советский Союз.

В октябре 1954 года в реферативном журнале Института научной информации (с 2004 года — Всероссийский институт научной и технической информации РАН) появилось сообщение о Джорджтаунском эксперименте. Оно стало стимулом для начала советских исследований в области машинного перевода. Уже в 1955 году в Институте точной механики и вычислительной техники АН СССР разработали первый советский компьютерный переводчик, использовавший словарь из 2300 слов. А через год, в 1956-м, в Москве появилось Объединение по машинному переводу.

В мае 1958 года прошла первая в СССР конференция по машинному переводу. На ней обсуждались проблемы перевода не только с английского, но и с других языков — арабского, норвежского, вьетнамского, китайского и так далее.

1960-е и 1970-е: комиссия ALPAC и система ЭТАП

Хотя Джорджтаунский эксперимент был, несомненно, впечатляющим, найти деньги для дальнейших исследований он не слишком помог. Все они стоили довольно дорого, и в 1964 году Пентагон и Национальный научный фонд США создали Консультативный комитет по автоматической языковой обработке (Automatic Language Processing Advisory Committee, ALPAC). Комитет должен был оценить, целесообразно ли финансировать разработки в области машинного перевода.

В 1966 году был опубликован отчет, после которого интерес американских ученых к машинному переводу угас, как отмечает Джон Хатчинс, примерно на 20 лет. Эксперты ALPAC рассматривали это направление чисто с практической точки зрения и пришли к выводу, что работа живого переводчика будет дешевле и качественнее. К тому же спрос на переводы не так уж велик: по данным ALPAC, из 4000 переводчиков, которые числились тогда в штате госучреждений США, постоянно были загружены только около 300. В итоге специалисты посчитали, что финансирование машинного перевода бесперспективно, тем более что его качество оставляло желать лучшего.

Тем не менее именно в 1960-е стали появляться и первые коммерческие разработки в этой области. В 1968 году Питер Тома, бывший сотрудник Джорджтаунского университета, открыл в Сан-Диего компанию Systran. Она специализировалась на создании программ для машинного перевода и технологий, позволяющих его ускорить. Хотя по качеству такой перевод заметно уступал человеческому, в 1969 году компания подписала контракт с Минобороны США и постепенно стала работать не только с русским и английским, но и с другими языковыми парами.

Отчет ALPAC повлиял и на советские исследования в области машинного перевода — интерес к ним заметно снизился. Тем не менее работа не остановилась совсем. Так, в 1974 году в институте «Информэлектро» начали создавать систему ЭТАП — электротехнического автоматического перевода — на основе модели «смысл — текст».

Модель «смысл — текст» была разработана советским лингвистом И.А. Мельчуком в 1960-х годах. Она предполагала, что любой язык — это способ преобразовывать смыслы в соответствующие им тексты и наоборот. Фактически такое утверждение описывает модель перевода с языка на язык.

1990-е и 2000-е: статистические системы

К 1990-м годам стало понятно, что описать естественный язык с помощью понятных машине правил достаточно сложно. Исследователи начали искать другие пути.

Например, компания IBM разработала систему машинного перевода Candide. В некотором роде это был возврат к идеям Уоррена Уивера — текст на языке оригинала рассматривался как зашифрованный текст на языке перевода. Алгоритм подсчитывал, сколько раз слово было переведено определенным образом в определенном сочетании, и предлагал соответствующий вариант. В расшифровке могли быть некоторые ошибки, но все же в целом она была понятной.

Так начали появляться статистические системы машинного перевода — Statistical Machine Translation (SMT). Они анализировали множество примеров параллельных текстов — на языке оригинала и языке перевода — и самостоятельно выделяли из них правила. SMT лучше работали с омонимами, идиомами и многозначными словами, чем RBMT-системы. А еще были более обучаемыми: чем больше текстов проходило через алгоритм, тем больше статистики он собирал и тем точнее предлагал варианты. Неудивительно, что с развитием интернета перевод, основанный на правилах, использовался все реже.

Впоследствии появилась более эффективная версия статистического перевода — перевод на основе фраз (Phrase-based Machine Translation, PBMT). Теперь алгоритм мог анализировать и сопоставлять не только отдельные слова, но и целые фразы. Это позволило более точно переводить, например, устойчивые выражения.

До 2016 года на рынке господствовали именно статистические онлайн-переводчики: всем известный Google Translate (2007), Яндекс Переводчик (2011) и другие. В 2016 году ситуация стала меняться — появился нейронный машинный перевод.

2016–2022: перевод и нейросети

В сентябре 2016 года команда Google Brain опубликовала статью о своей системе нейронного машинного перевода (Neural Machine Translation, NMT). Речь о таких системах шла еще в нулевых. В отличие от предыдущих систем, в NMT алгоритм рассматривает предложение не как совокупность слов и фраз, а как цельную единицу текста. В результате количество ошибок при онлайн-переводе резко сократилось, а точность повысилась.

В июле 2017 года Google представила новую архитектуру нейросетей — Transformer. Такие нейросети эффективнее считывали связи между словами, стоявшими в предложении далеко друг от друга. Например, в предложении «I arrived at the bank after crossing the…» перевод слова bank зависит от того, что находится в конце фразы:

I arrived at the bank after crossing the road («Я пересек дорогу и оказался в банке»).
I arrived at the bank after crossing the river («Я пересек реку и оказался на берегу»).

Такие предложения корректно переводились и раньше. Но нейросети архитектуры Transformer анализируют контекст эффективнее.

В сентябре 2017 года нейросети архитектуры Transformer стали использовать и в Яндекс Переводчике. Яндекс применяет сразу два метода: статистический и нейронный. Программа выполняет перевод по обеим моделям, а затем алгоритм, основанный на методе машинного обучения CatBoost, предлагает пользователю лучший из двух вариантов.

В последние годы машинный перевод начали использовать и в других целях — для работы с видео. Например, в 2021 году в Яндекс Браузере появилась функция закадрового перевода англоязычных видео на YouTube и других сервисах. Пользователю достаточно нажать одну кнопку в проигрывателе, подождать пару минут — и можно смотреть ролик с озвучкой на русском языке. Все это благодаря работе нейросетей. Позже добавились и другие языки — немецкий, французский, испанский, итальянский.

А в августе 2022 года Яндекс добавил возможность автоматического закадрового перевода прямых трансляций — сейчас технология находится в публичном тестировании. Как она устроена? Одна нейросеть распознает речь и превращает ее в текст, когда фразу даже еще не закончили произносить. Вторая определяет пол спикера. Третья расставляет знаки препинания и таким образом выделяет в речи смысловые фрагменты. Именно они отправляются четвертой нейросети — благодаря этому переводить удается почти на лету. Последняя, пятая, нейросеть отвечает за синтез речи. Технология позволяет смотреть интервью или презентации самых ожидаемых технологических новинок — в прямом эфире и сразу на русском языке. Работу технологии перевода прямых трансляций можно протестировать на примере «вечного» стрима NASA.