Ди Ди

+40 333
с 2017
527 подписчиков
27 подписок

Сделано в Riffusion (около года назад). Из TTS мне пока больше вего понравилась модель от Google если ей немного выкрутить температуру (можно запустить в их AI Studio). Но хорошо будет работать только с небольшими кусками текста, если пытаться скормить что-то длинное - захлебнется уже на пятом - шестом абзаце.

1

Так это они и есть. Семья Macgrow. Просто решили песенку про русских спеть

Стивен Кинг «Поле боя» ;)

Есть кейсы для которых этот формат будет работать гораздо лучше чем предыдущий. Просто модели очень различаются по возможностям и применению.

Анимация тут на совершенно ином уровне. По сути это лучшая модель для генерации анимационных шотов.

На этом форуме кто-нибудь другие слова знает? Или уже совем в деградировали?

Кал это вы делаете, батенька. А нейронки молодцы... )))

1