Насколько сейчас тяжело синтезировать голос человека?

Нужна ли абсолютно чистая запись или даже видео подходят? И потом подцепить к нейросетке, чтобы его образ жил и мог разговаривать?

Чистая желательна, но не обязательна
Чем больше материалов, тем лучше. При достаточном количестве материала даже записи с помехами и искажениями подойдут.