Искусственный интеллект меняет мимику под выбранный язык, из-за чего ролики получаются максимально правдоподобными.
А есть такая же нейросеть, но только чисто для голоса?
https://github.com/svc-develop-team/so-vits-svc