Новая модель Qwen3-ASR от Alibaba меняет правила игры в распознавании речи, справляясь с 12 языками, фоновым шумом и даже музыкальными жанрами.
Qwen3-ASR от Alibaba — новая нейросеть для распознавания речи. Она поддерживает 12 языков и отлично работает даже в шуме, справляясь с песнями и рэпом.
Нейросеть для распознавания речи — Qwen3-ASR.
Её сделали ребята из Alibaba. Она реально универсальная и вышла совсем недавно, в сентябре.
— Что она умеет
- Знает 12 языков, включая наш русский и английский.
- Сама понимает, на каком языке ты говоришь. Не надо ничего указывать заранее.
- Отлично распознает речь, даже если вокруг шумно, звук тихий или ты стоишь далеко.
- Справляется с песнями, рэпом и просто неразборчивым бормотанием. Говорят, что ошибок в таких сложных случаях меньше 8%.
- А ещё можно заранее дать ей имена или сложные термины. Так она распознает их без ошибок.
Эксплуатирование
- Нейросеть доступна через API (для разработчиков и бизнеса), но есть и бесплатные демоверсии на HuggingFace и ModelScope.
🔗 Qween3-ASR
📌 70+ нейросетей в одном месте без Vpn - ТУТ
2 комментария