Подскажите какой нейросетью можно анимировать фото с озвучкой текста по голосовому шаблону. Чтобы липсинк совпадал и голос был как в шаблоне.
Я знаю одну нейросеть, называется гугл.