Я, когда играл в демку, в первую очередь подумал не про ИИ, а про безымоциональность и невыразительность реплик.
Можно было попытаться создать слепки нужных голосов, например, в оффлайн DeepFakeVoice, потом найти увлеченного товарища и озвучить все реплики его голосов, а потом заменить нужными слепками через, например, MMVC. Да, получилось бы не идеально, но уж точно не настолько пресно, как после начитки нейросетью или даже ртом в майк.
Кстати я удивлен что современные ии генераоры звука не дают возможность добавить в речь окраса или хотя бы ударений
Казалось бы можно сразу сделать ии генератор который будет понимать не чисто текст - но и дополнитеьные знаки и символы для окраса речи. Но нет - тут лошади даже и не валялось Обычно ограничиваются одним воровстом голоса актера Наверное потому что иначе для записи голоса придется тратить в х10 больше времени, что бы записать один и тот же голос в разных вариациях
Я, когда играл в демку, в первую очередь подумал не про ИИ, а про безымоциональность и невыразительность реплик.
Можно было попытаться создать слепки нужных голосов, например, в оффлайн DeepFakeVoice, потом найти увлеченного товарища и озвучить все реплики его голосов, а потом заменить нужными слепками через, например, MMVC.
Да, получилось бы не идеально, но уж точно не настолько пресно, как после начитки нейросетью или даже ртом в майк.
Кстати я удивлен что современные ии генераоры звука не дают возможность добавить в речь окраса или хотя бы ударений
Казалось бы можно сразу сделать ии генератор который будет понимать не чисто текст - но и дополнитеьные знаки и символы для окраса речи.
Но нет - тут лошади даже и не валялось
Обычно ограничиваются одним воровстом голоса актера
Наверное потому что иначе для записи голоса придется тратить в х10 больше времени, что бы записать один и тот же голос в разных вариациях
Да даже в самой элевенлабс куча пресетов и возможности клонировать любой голос