Новая модель Qwen3-ASR от Alibaba меняет правила игры в распознавании речи, справляясь с 12 языками, фоновым шумом и даже музыкальными жанрами.

Qwen3-ASR от Alibaba — новая нейросеть для распознавания речи. Она поддерживает 12 языков и отлично работает даже в шуме, справляясь с песнями и рэпом.

Новая модель Qwen3-ASR от Alibaba меняет правила игры в распознавании речи, справляясь с 12 языками, фоновым шумом и даже музыкальными жанрами.

Нейросеть для распознавания речи Qwen3-ASR.

Её сделали ребята из Alibaba. Она реально универсальная и вышла совсем недавно, в сентябре.

— Что она умеет

  • Знает 12 языков, включая наш русский и английский.
  • Сама понимает, на каком языке ты говоришь. Не надо ничего указывать заранее.
  • Отлично распознает речь, даже если вокруг шумно, звук тихий или ты стоишь далеко.
  • Справляется с песнями, рэпом и просто неразборчивым бормотанием. Говорят, что ошибок в таких сложных случаях меньше 8%.
  • А ещё можно заранее дать ей имена или сложные термины. Так она распознает их без ошибок.

Эксплуатирование

  • Нейросеть доступна через API (для разработчиков и бизнеса), но есть и бесплатные демоверсии на HuggingFace и ModelScope.

    🔗 Qween3-ASR

    📌 70+ нейросетей в одном месте без Vpn - ТУТ
2 комментария