Я уже писал статью про очень годную сетку по переводу голоса в текст, но многие спрашивали про наоборот. Так вот:
Tortoise TTS пока что всё еще непревзойденный из бесплатных, конечно жаль что генерируется всё в нем очень долго
И образцы голоса можно любые загружать, как в ElevenLabs