Голосовой помощник Google и Google Translate в последние годы развиваются очень быстро. Они лучше слышат и понимают нашу речь, но всё равно из-за тугоухих машин мы попадаем в неловкие ситуации.
На Чемпионате мира по футболу в России иностранцы часто пользовались сервисами Google - спрашивали, где найти пиво и стадион. Тут техника не подводила, но 5-я часть опрошенных сказала, что перевод заставлял краснеть и носителей языка, и иностранцев, потому что получались жуткие или смешные и нелепые вещи. И так по всему миру.
Например, валлийский язык мало кто знает в Британии. Но Уэльс входит в её состав, поэтому знаки на дороге меняют британские службы. Надпись "Готовится взрыв" был представлен как "Gweithwyr yn ffrwydro" или "рабочие взрываются". А пользователь Google Translate обнаружил, что если ввести по-английски слово "собака" 18 раз, то получится перевод с языка маори:
"Часы Судного дня - без трёх минут двенадцать. Мы представляем персонажей и драматические события в мире, которые указывают на то, что мы всё больше приближаемся к концу времён и возвращению Иисуса."
Жуть. Но почему искусственный интеллект продолжает совершать ошибки?
Во-первых, слова часто имеют более одного значения. Это может привести к затруднениям не только для обычных пользователей, но и для власти. Правительство Великобритании перевело немецкую версию "Белой книги" Брексита: "демократический процесс" (demokratische Übung) стал "физическими упражнениями", а не "процессом".
Машины пытаются учиться и использовать контекст для более правильного перевода. Они используют ранее переведённые тексты, чтобы понять, как слово использовалось раньше, и выбирают наиболее вероятное значение.
В 2018 году Microsoft объявила, что достигла качества переводов, равных "человеческим". Ключом к этому прорыву стало использование глубоких нейронных сетей, а также статистического машинного перевода. Первый "грубый" перевод компьютер уточнял в контексте, сравнивая значения слова так, как это делают люди.
"Современные системы перевода не следуют правилам перевода с одного языка на другой, а преобразуют текст из существующих, "человеческих" переводов. Они используют последние достижения в области прикладной статистики и машинного обучения",
- объясняет Сюэдун Хуан, технический сотрудник Microsoft Research по вопросам речи и языка.
Однако и Microsoft признаёт, что перевод живого человеческого разговора, где есть идиомы, акцент и диалекты - сложнее для компьютера, чем перевод научной статьи.
Сейчас Google, Microsoft и технические стартапы работают над наушниками, которые с помощью смартфона будут переводить с 15, 30 и 40 языков - получится карманный синхронный переводчик. Но даже если с последовательным переводом машины справляются кое-как, то синхронный перевод нам придётся ждать ещё долго.