В Facebook новый метод перевода: ИИ сравнивает языки как математические примеры

10 октября 2019, 15:38
В Facebook новый метод перевода: ИИ сравнивает языки как математические примеры
Искусственный интеллект Facebook научился видеть разные языки как математические примеры. "Умные" алгоритмы сравнивают их и выявляют сходства. В итоге получается готовый перевод без всяких словарей.

Пользователи Facebook говорят примерно на 150 разных языках. Чтобы все они понимали друг друга и чтобы сеть стала более доступной и привлекательной для новых юзеров, Facebook развивает алгоритмы машинного перевода. Но даже для современных систем, которые автоматически переводят предложения и целые тексты, нужны словарные базы.

Такие встроенные словари есть далеко не для каждой пары языков: для пополнения словарей и обучения алгоритмов нужны двуязычные тексты, но в случае с малораспространёнными языками их может просто не существовать. Например, система с лёгкостью переведёт текст с английского на русский, но перевод пары урду-баскский, скорее всего, не удастся или будет очень неточным.

В парижской лаборатории Facebook придумали использовать другой подход к переводу: вместо расширения словарей языки превратят в математические модели, и процесс перевода станет своего рода решением примера.

Этот метод основан на математическом сравнении единиц словарного состава языка — лексем. Работает это так: искусственный интеллект раскладывает предложение на отдельные элементы-векторы, сопоставляет их и затем переводит.

"Во всех языках слова "кошка" и "собака" будут иметь довольно близкие векторы... А все векторы, которые представляют названия стран, будут занимать примерно одинаковую позицию."

Исследователи говорят, что такой математический метод "без вспомогательных данных" ещё предстоит совершенствовать, но для быстрого перевода он вполне сгодится уже сейчас.