Google исполнилось 20 лет, а голосовой помощник всё так же плох. Почему?

25 сентября 2018, 15:03

Голосовой помощник Google в последнее время очень изменился. Понимает речь лучше, переводы точнее. Но не совсем. Рассказываем о нелепых ошибках Google и как они помогают ему учиться.

Голосовой помощник Google и Google Translate в последние годы развиваются очень быстро. Они лучше слышат и понимают нашу речь, но всё равно из-за тугоухих машин мы попадаем в неловкие ситуации.

На Чемпионате мира по футболу в России иностранцы часто пользовались сервисами Google - спрашивали, где найти пиво и стадион. Тут техника не подводила, но 5-я часть опрошенных сказала, что перевод заставлял краснеть и носителей языка, и иностранцев, потому что получались жуткие или смешные и нелепые вещи. И так по всему миру.

Например, валлийский язык мало кто знает в Британии. Но Уэльс входит в её состав, поэтому знаки на дороге меняют британские службы. Надпись "Готовится взрыв" был представлен как "Gweithwyr yn ffrwydro" или "рабочие взрываются". А пользователь Google Translate обнаружил, что если ввести по-английски слово "собака" 18 раз, то получится перевод с языка маори:

"Часы Судного дня - без трёх минут двенадцать. Мы представляем персонажей и драматические события в мире, которые указывают на то, что мы всё больше приближаемся к концу времён и возвращению Иисуса."

Жуть. Но почему искусственный интеллект продолжает совершать ошибки?

Во-первых, слова часто имеют более одного значения. Это может привести к затруднениям не только для обычных пользователей, но и для власти. Правительство Великобритании перевело немецкую версию "Белой книги" Брексита: "демократический процесс" (demokratische Übung) стал "физическими упражнениями", а не "процессом".

Машины пытаются учиться и использовать контекст для более правильного перевода. Они используют ранее переведённые тексты, чтобы понять, как слово использовалось раньше, и выбирают наиболее вероятное значение.

В 2018 году Microsoft объявила, что достигла качества переводов, равных "человеческим". Ключом к этому прорыву стало использование глубоких нейронных сетей, а также статистического машинного перевода. Первый "грубый" перевод компьютер уточнял в контексте, сравнивая значения слова так, как это делают люди.

"Современные системы перевода не следуют правилам перевода с одного языка на другой, а преобразуют текст из существующих, "человеческих" переводов. Они используют последние достижения в области прикладной статистики и машинного обучения",

- объясняет Сюэдун Хуан, технический сотрудник Microsoft Research по вопросам речи и языка.

Однако и Microsoft признаёт, что перевод живого человеческого разговора, где есть идиомы, акцент и диалекты - сложнее для компьютера, чем перевод научной статьи.

Сейчас Google, Microsoft и технические стартапы работают над наушниками, которые с помощью смартфона будут переводить с 15, 30 и 40 языков - получится карманный синхронный переводчик. Но даже если с последовательным переводом машины справляются кое-как, то синхронный перевод нам придётся ждать ещё долго.