Киану из Ривии и другие метаморфозы. Бесплатный синтез речи для ваших проектов

Здравствуй, DTF! На связи CEO лаборатории Общего ИИ Mind Simulation Леонид, и сегодня я хочу поделиться последними новостями и показать как мы, помимо переноса голосов между языками, можем их смешивать, а также создавать уникальные голоса с нуля.

С момента публикации нашей прошлой статьи прошло уже достаточно времени. Есть несколько новостей, которые следует выделить:

Мы сделали сервис бесплатным на некоторое время, чтобы поддержать сообщество создателей контента, разработчиков игр, энтузиастов и всех, кому интересен или нужен синтез речи: сейчас вы можете бесплатно активировать любой тариф на платформе и свободно пользоваться всеми голосами (иногда бывают небольшие очереди из-за наплыва пользователей);
Мы провели ребрендинг в SteosVoice, домен пока остался прежним: связано это с регистрацией (наконец-то) основного товарного знака для всех наших продуктов;
Акцент стал ещё менее заметен при переносе голоса на другой язык;
На платформе появились новые голоса, теперь мы будем добавлять их более системно;
Технология теперь может смешивать голоса, а также генерировать новые: эти голоса также мультиязычны и говорят на двух языках;
Mind Simulation стали приглашёнными экспертами в репортаже Pro-Hightech по теме Общего Искусственного Интеллекта: если вам в целом интересна тема ИИ, советую ознакомиться;
Мы скопировали голос и озвучили ролик у Доктора Гнуса: если здесь есть его подписчики, то это must-see.

А теперь давайте подробнее разберёмся со смешиванием и генерацией голосов.

Первый вопрос, который вероятно имеет смысл задать: зачем это всё нужно? Зачем нам развиваться в эту сторону, будет ли это востребовано.

Мы считаем, что это важная веха, которую нужно взять в развитии этой технологии как инструмента озвучки, так и, в том числе, вспомогательной технологии для Общего ИИ.

Чем больше у нас возможностей в миксовании голосов, создании новых, тем больше горизонтов открывается:

тонкая настройка голоса своего интеллектуального помощника или диктора озвучки книги, например;
практически бесконечные возможности в подборе и корректировке голосов для персонажей игр, озвучки кино и так далее (с поправкой на мультиязычность);
использование в реальном времени в дальнейшем без привязки к механизму постобработки голоса;
и другие.

Послушаем пару примеров.

Как звучат оригинальные голоса вы можете послушать на самой платформе или в предыдущей нашей статье, так как некоторые недоступны на платформе.

Mind Simulation

Gamedev

17.02.2022

Гейб Ньюэлл и другие читают статьи на DTF

Привет, DTF! Это наш эксперимент по озвучке отрывков из лучших статей DTF за неделю. Если эксперимент зайдёт, то будем периодически публиковать аудио версии статей.

Смешивать можно в разных пропорциях и неограниченное количество голосов, не обязательно именно два.Также не имеет значение носителями какого языка был источники голосов, которые смешиваются.

Доступ к функции на платформе пока не доступен, новые голоса создаём самостоятельно и публикуем их на платформе.

Теперь давайте послушаем пример полностью синтетического голоса, у которого нет исходных данных. Актёр его не записывал, оригинальные аудио отсутствуют.

Интересно услышать ваше мнение на счёт конкретно этого голоса. Насколько чётко вы слышите его искусственность? Приятен ли он на слух? Приглашаю в комментарии.

Ниже оставлю ссылку на ролик Доктора Гнуса с нашей озвучкой (есть места где синтетик Гнус ставит неправильные ударения или интонации, когда он предстаёт на экране: это было сделано специально, чтобы отдалить его от настоящего и представить немного роботом).

Запрещенная фольклорная игра. ( Доктор Гнус / Анимация )

Также делюсь новой демкой, где мы попробовали переозвучить часть трейлера Ведьмак 3, которого, насколько мне известно, не было с русской озвучкой.

Демо-переозвучка трейлера Ведьмак 3: голос оригинальной озвучки говорит по-русски

Сервис SteosVoice на данный момент полностью бесплатен. Все голоса и никаких ограничений, синтезируйте столько аудио, сколько нужно.

Поддержать разработку вы можете на Boosty и Patreon.

Благодарю за внимание и приглашаю в комментарии!

33 комментария

Аккаунт удален

02.09.2022

Комментарий недоступен

Ответить

Автор

Благодарю! Будем двигаться дальше

Lex Miller

Спасибо, очень крутой проект. Для инди геймдева просто находка.

03.09.2022

Спасибо!

Сергей

Бля, спасибо! Давно искал такое, чтобы всякие пасты зачитанные голосом ведьмака кидать. Оч годно

KindaBusyEnterprise

Привет! Ещё раз выражаю огромную благодарность за бесплатные тарифы
Мы с Вами под каким-то постом общались пару недель назад, я перевожу книгу с английского языка и была мысль сделать при помощи Вашего сервиса аудиокнигу
Я в итоге попробовал, совмещая Ваши голоса и голоса того бота в телеграме, который умеет голосами из Warcraft 3 говорить
Довольно тяжёлый процесс, у меня, например, не получается сказать в Вашем сервисе "все"
То есть, я пишу "Все считали...", а голос говорит "Всё считали..."
Я пытался звук этот менять в расширенных настройках, вроде даже английские звуки подставлял, но получается "Всэ считали"
Ну и конечно минус, что у таких сервисов детских голосов нет
Книга про странную школу, там действующие герои 3-4 взрослых и около 25 детей, так что получается не особо удачно
Ну а так было интересно попробовать, я делал так, чтобы Ваш голос "Старец рассказчик" читал книгу, а слова героев произносил уже другой голос, который я привязывал к персонажу
Ну и забавно, что при одном и том же тексте при повторной генерации голос может его немного с разными интонациями читать
И если текст очень длинный, то голос будто бы начинает со временем уставать - становится каким-то слишком плоским, что ли
То есть, оптимальнее получается генерировать по абзацу за раз
Ну а так ещё раз спасибо за сервис, может со временем возрожу эту идею

Здравствуйте, ещё раз:) Благодарю! По поводу всё и всё: сейчас это пофиксили, должно работать нормально, попробуйте (словарь некорректно работал и принудительно менял одно слово на другое).

Детские голоса, да, большая редкость. Мы планируем сделать несколько

Киану из Ривии и другие метаморфозы. Бесплатный синтез речи для ваших проектов

Смешивание голосов и генерация новых