Компания Meta(запрещенная на территории РФ) выпустила свою нейросетевую модель которая способна распознавать 1107 языков

И переводить голос в текст. И наоборот. Код и веса моделей уже выложены на гит, но пока запустить смогут только пользователи владеющие командной строкой. Уверен что до завтрашнего дня этот момент уже будет поправлен, как только это произойдет, сообщу об этом на канале. Проект бесплатный (как и Whisper, о котором я писал недавно, который очень хорош, но поддерживает не так много языков и диалектов).

Так же они предлагают преобразовывать текст в голос с помощью другой нейросети под названием VITS, которая отлично справляется с переводом текста в речь для английского языка, но сожаление я не нашел примеров того как она справляется с неанглоязычным текстом. Послушать ее демки можно тут.

_

Канал Нейроновости - источник новостей о нейронках, подпишись чтобы не пропускать

6.4K6.4K показов
930930 открытий
16 комментариев

А сможет ли она распознать солнечный и кирпичный языки? 🤔

Ответить

Я успешно обучал чатГПТ кирпичному 👀

Ответить

Солёный ты хотел сказать?

Ответить

7 миллиардов живёт на одной планете но почему то не могут разговаривать на одном языке.

Ответить

Нехуй было Вавилонскую башню строить. Сейчас бы все на одном языке говорили

Ответить

Даже маленькая Англия не может, как о всем мире говорить?)

Ответить

Наконец-то посмотрю тонны интервью Хаяо Миядзаки на японском. Только надо разобраться как запустить эту приблуду)

Ответить