Статья удалена
Самая душная на свете статья о «поющем анимешном синтезаторе».
Дисклеймер
Автор статьи не является экспертом или специалистом в какой-либо области. Разве что просто умеет пользоваться гуглом (и даже это он делает так себе). К любой информации стоит относиться со скептицизмом и перепроверять самостоятельно. Ссылки на источники будут внизу.
Оглавление
Список заголовков предназначен не столько для навигации, сколько для превьюирования статьи. Ибо некоторым может быть не интересно читать предысторию и они хотели бы сразу перейти к прослушиванию музыкального контента — он преимущественно в разделах 5 и 6.
Заранее предупреждаю, в своих мыслях и рассуждениях заходить буду издалека и продвигаться очень далеко. Будет затронуто множество имён и фамилий. Всё для того, чтобы читатель понял: за феноменом поющей перед ним на экране девочкой стоят миллионы часов труда людей со всего мира.
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀2.1 — Метод синтеза
⠀⠀⠀⠀⠀⠀2.2 — Создание войсбанка
⠀⠀⠀⠀⠀⠀2.4 — Vocalistener
⠀⠀⠀⠀⠀⠀5.1 — Японские
⠀⠀⠀⠀⠀⠀5.2 — Английские
⠀⠀⠀⠀⠀⠀5.3 — Испанские
⠀⠀⠀⠀⠀⠀5.4 — Другие языки
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀⠀
Часть 0 — Культурные предпосылки
Может показаться странным, но сама идея виртуального вокального исполнителя появилась не так уж давно. Во всяком случае, массово задумываться о возможности того, что робот или компьютер сможет петь, как живой человек, люди стали примерно последние несколько десятков лет. И уж что, но сымитировать живые человеческие эмоции при исполнении песен бездушная программа ну никак не сможет, казалось людям. Но фантастика на то и фантастика, чтобы фантазировать, не правда ли?
Вот люди и фантазировали.
1994 год, аниме «Macross Plus», виртуальный концерт виртуального же исполнителя под именем Sharon Apple. Тот случай, когда японцы сами предвосхитили и расписали своё будущее на годы вперёд. По описанию персонаж является вполне себе полноценным ИИ, работу которого самую малость должен корректировать оператор-продюсер. В ход, помимо музыки, идут голограммы, сюжетные постановки и немного интерактива. Почти полный набор того, что нам предстоит увидеть далее по ходу статьи, хоть тут всё специально изображено в очень гиперболизированном и нарочито фантастическом виде.
Далее нужно отметить роман Уильяма Гибсона под названием «Идору».
Цитата из книги
– А у них правда есть исполнители, которые не существуют?
– Певцы-идолы. – Он скользнул взглядом по крутому горбу моста. – «Идору». Некоторые из них пользуются бешеной популярностью.
– А бывает, чтобы кто-нибудь из-за них убил себя?
– Я не знаю. Но думаю, что такое вполне возможно.
– А чтобы кто-нибудь на них женился?
– Насколько я знаю – нет.
Да уж. Нихрена этот Гибсон не разбирался в японцах. Во всяком случае, нынешняя Япония в этом плане гораздо интереснее той, которую он описывал в своих книгах. Ибо нынешние японцы способны жениться на чём угодно, что хотя бы малость напоминает человека. А остальной мир уже давно свыкся с их причудами.
Забавно, но, как и в случае с "Нейромантом" и "Бегущим по лезвию", Гибсона опять опередили создатели из индустрии кино. На этот раз — анимационного. Ведь "Идору" был издан спустя пару лет после "Макроса Плюс". Не везло деду быть пионером во всём, что могло быть связано с предсказанием развития общества и технологий. Причём если "Бегущий" опередил "Нейроманта" в основном лишь по духу и атмосфере, то "Макросс" по сути зародил саму концепцию виртуального айдола, в обход всяких литературных прообразов.
Так же сильно удручает то, что наш «предсказатель будущего» не обратил внимание на разрастающуюся сладострастную опухоль в виде трендов на «моэ» и «кавайи», окончательно убившие остатки «самурайского духа» в японцах. И продолжал писать свои произведения про злые расчётливые дзайбацу с якудзами в будущем.
К чему это всё? К тому, что предсказать развитие технологий довольно легко. Гораздо сложнее предсказать развитие культуры.
Кстати, есть мнение, что именно "Макросс" уничтожил жанр "меха" — он просто в какой-то момент окончательно скатился в истории о поющих айдолах.
Хотя это уже тема для другой, отдельной статьи (которой никогда не будет).
Но что-то мы замечтались. У нас на дворе пока что 2021 год, а не 2077. Ни о каком ИИ, который бы эмулировал сознание с эмоциями и на лету генерировал контент при минимальном участии человека, говорить пока не приходится.
Так что вперёд, в прошлое!
Часть 1 — История создания
Начнём с того, что попытки синтеза вокала предпринимались задолго до появления первых прототипов предмета статьи. Однако возможности зачастую ограничивались лишь синтезом гласных звуков.
Одна из ранних и самых успешных попыток — фрагмент песни "Царица ночи" из оперы Моцарта "Магическая флейта", предпринятая двумя исследователями из французского института IRCAM — Ивом Потардом и Ксавье Роде — в 1984 году.
Полученный таким образом вокализ (пение без слов и только гласными звуками) вполне себе подходит под стандарты классической музыки. Вообще парадоксально, но чем дальше разработчики отходят от академических стандартов, тем сложнее становится сымитировать человеческое пение. И таки да, нужно было идти дальше, создавать более полноценные и многофункциональные решения.
Но возвращаемся к нашему предмету статьи.
Итак, 1997 год. Довольно занятно, но начинается всё не в Японии. А в Испании. В Барселоне, в исследовательском центре MTG университета Помпеу Фабра. За первые наработки отвечал некто по имени Жорди Бонада.
Первый проект именовался «Элвис» и ставил своей задачей осуществить базовые принципы морфинга звука для плавного перехода между фонемами. В какой-то момент проект стал «чересчур сложным и громоздким» (что бы это не значило) и так и не смог стать полноценным продуктом, готовым на продажу.
Однако исследователей из Барселоны заметили японцы из Yamaha и предложили взаимопомощь. В срочном порядке в качестве руководителя был прислан Хидеки Кенмоти (получивший в дальнейшем неофициальный титул «отец вокалоидов»). И был начат новый проект под кодовым именем «Daisy» (в честь песни «Daisy Bell»). Большая часть исполнительных библиотек программы была написана испанцами, тогда как японцы отвечали за дизайн продукта и маркетинговые исследования.
Как и в случае с другими подобными решениями, поначалу программа могла работать только с гласными. Первым словом было "ai" — любовь. Но позже — спустя 4 месяца — была осуществлена и работа с согласными. Первым словом с согласным звуком было "asa" — утро.
По словам Кенмоти, выбрать название для конечного продукта было сложно. Вариант "VOCALOID" — очевидная комбинация слов "vocal" и "android" — был третьим по счету. Выбор пал на него после того, как возникли трудности с авторскими правами на второе в списке — неизвестное нам слово уже было зарегистрировано в Бельгии в качестве торговой марки.
Релиз первой версии состоялся 15 января 2004 года.
Часть 2 — Принцип работы
2.1 — Метод синтеза
Принцип, на котором основан синтез вокалоидов, называется "конкатенативный" (попробуйте произнести это слово вслух). Это значит, что синтез осуществляется комбинированием множества отдельных заранее записанных звуков — фонем. В случае с вокалоидами, записываются в том числе и сочетания фонем — целые слоги. Плавный переход между частями осуществляется морфингом через кроссфейд.
Важно отметить, что кроссфейд по своей сути является линейной интерполяцией. И здесь нужно отметить одну очень важную, фундаментальную проблему такого подхода: работа с согласными звуками в такой среде — это ад. А если точнее, то работу с т.н. "фрикативами". И, в особенности, с "сибилянтами".
Чем же они отличаются от других звуков? Для этого нужно глянуть на спектрограмму.
Структурируя вышеуказанную информацию, можно сделать вывод, что гласные звуки — это звуки тонального происхождения. Они состоят из четкого набора гармоник — колебаний звука определенной частоты. А согласные (в особенности сибилянты) — звуки шумового происхождения. У них нет четко выраженного тона, их звучание размазано по всему спектру.
Что это значит в случае с вокалоидами? А это значит то, что когда производится линейная интерполяция между фонемами, происходит нарушение природной структуры спектра, которая у фрикативов нарочито хаотичная, шумовая, а не упорядоченная, как у гласных. Структура становится линейной, с линейным переходом между тонами и неестественным звучанием для таких звуков. Из-за этого мы слышим характерные роботоподобные артефакты. Чтобы такого не было, переход должен осуществляться с применением гораздо более сложных алгоритмов, с применением дизеринга и прочих умных слов. Решением этой я рада других проблем Yamaha занималась на протяжении всей истории существования программы, улучшая звучание с каждой новой версией движка синтеза (всего их было 5). Но общий принцип не менялся.
Но что-то я увлекся. Вообще с какого хрена я решил, что во всём этом разбираюсь? Забудьте всё вышенаписанное.
Ах да, так же есть ряд параметров, необходимых для более тонкой настройки звучания.
Работа с ними на таймлайне осуществляется вручную. Наиболее важными из них являются «pitch» (смещение тональности) и «dynamic» (громкость). Как правило эти два параметра сильнее всего влияют на правдоподобность и «живость» вокала. Остальные либо влияют намного слабее, либо их реализация оставляет желать лучшего и потому лучше их не трогать. Отдельно стоит упомянуть кросс-синтез. Это когда несколько войсбанков смешиваются методом кроссфейда в одном треке для получения более разнообразного, интересного и реалистичного звучания. Увеличивая головную боль для пользователя в геометрической прогрессии.
К сожалению, у автора статьи крайне мизерный опыт работы с редактором, потому никаких гайдов здесь не будет. Да и вообще статья не об этом.
2.2 — Создание войсбанка
Программа не может синтезировать звук из ничего. Для работы нужна установка войсбанка. К сожалению, создать свой войсбанк на основе своего голоса в данной программе невозможно. Архитектура программы и войсбанков целиком и полностью закрытая. Запись происходит исключительно в присутствии специалистов из Yamaha.
Однако нужно понимать, что принцип работы не уникален. Конкатенативный синтез давно уже не является вершиной технологий и очень многие разработчики софта его освоили, выпустив множество аналогов (о них мы чутка поговорим ближе к концу). Во всех случаях так или иначе запись войсбанка строится на зачитывании реклиста перед микрофоном.
О дальнейших тонкостях можно лишь предполагать, основываясь на скромной инфе из интернета и принципе работы более открытых аналогов.
Судя по всему, структура голосовых банков вокалоидов может различаться и порой довольно сильно. Так как существуют разные паттерны реклистов: CV, VC, CVC, VCV, VCCV, CVVC и так далее. Какие-то войсбанки могут использовать один паттерн, когда другие могут использовать несколько. В среднем для японского войсбанка используется около 500 звуков и он пишется за день, тогда как английский может содержать до 2500 и может записываться неделю.
Важно отметить, что недостаточно просто зачитать звуки и нарезать из них сэмплов для войсбанка. Звуки должны идеально подходить друг к другу по тональности и динамике. В противном случае количество артефактов при кроссфейде увеличивается. Это важный аспект, которым можно охарактеризовать качество записи войсбанка.
Так же для записи войсбанков как правило записывается несколько наборов звуков в разных тональностях. Такие войсбанки называются мультипитчевыми. Использование мультипитча значительно улучшает звучание войсбанка на разных тональностях, так как изменение тональности будет осуществляться не алгоритмами питч-шифтинга, а морфингом через кроссфейд. Обычно для вокалоидов записывают 3-4 питча.
Отдельно стоит отметить аппенды. Это войсбанки, записанные с голоса одного и того же человека, но в другой манере. Количество аппендов одного вокалоида для одного языка может достигать шести.
2.3 — Причины к использованию.
Может возникнуть резонный вопрос: а на кой хрен возиться с кучей параметров, вручную забивая каждый звук, если можно записать свой голос и обработать его фильтрами?
Ну, возможно в 2021 году это и стало реальным (в комментариях можете скинуть наводку, как это сделать, но только чтобы результат был правдоподобным). Но на момент создания данной технологии, возможности обработки звука были довольно ограниченными. Такая штука, как питч шифтер, по сей день имеет огромные проблемы, когда нужно сдвинуть звук на несколько тонов выше. А о сносном переносе звука на октаву или две вообще не может быть речи. Так как синусоиду хоть и можно преобразовать в другие частоты, но структура гармоник останется прежней. Так же необходимо отделение форманты и обработка согласных и гласных звуков отдельно. Суть в том, что звук "а" будет по-разному звучать у мужчины и женщины, но звук "с" будет звучать примерно одинаково у всех людей. Происходит это из-за того, что гласные модулируются через колебания голосовых связок (которое у разных полов и возрастов структурно различаются, само собой), а согласные — турбулентными завихрениями воздуха, когда тот проходит через зубы, губы и язык, которые структурно у всех примерно одинаковы. Это всё очень важные тонкости.
Поэтому, когда у музыкантов (в большинстве своём суровых дядек) появилась возможность сделать своими руками песню, которая поётся женским голосом, они сразу оживились и проявили интерес к этой программе.
Особо важно отметить культурные особенности конкретно японцев. Среднестатистический японец — довольно одинокий и замкнутый в себе человек, который мало общается с другими людьми, с трудом заводит новые знакомства. И потому для огромного множества японцев (способных слабать на гитаре и в DAW мелодию) вокалоид был очень годной находкой, так как не было необходимости искать себе вокалиста. Человек мог в одиночку не выходя из дома сделать свой маленький хит, получив популярность и признание после релиза в соцсетях.
2.4 — Vocalistener
Сейчас начнётся суровое откровение. Суть в том, что есть штука, о которой знает довольное небольшое количество пользователей программы и еще меньшее количество простых слушателей.
Суть данной штуки в том, что она позволяет использовать голос для того, чтобы тонко настроить управляющие параметры. Эдакий motion capture для заранее записанного голоса. Получается парадоксальная ситуация: пользователь может создать песню не задействуя свой голос, но для хорошего звучания он таки должен уметь петь. Чувствуете, как магия технологии улетучивается?
Так что учтите этот момент. Если вы будете слышать милое и реалистичное вокалоидное пение, то оно почти наверняка было получено благодаря тому, что какой-то жирный потный музыкант-отаку пел эту же песню в процессе создания музыки.
Вот, кстати, полная версия этого трека. Потрясающий пример японской народной песни в стиле «энка». Такого с применением вокалоидов делают очень мало. Вокал начинается с 0:38.
Часть 3 — Развитие и продвижение
3.1 — Основной курс — на запад?
Судя по всему, изначально Yamaha сильно рассчитывала выпустить продукт, который будет пригоден для как можно более массовой аудитории — англоязычной. Хотя и про свою родную не забывала — японскую. Посудите сами. Для первой версии было выпущено три английских войсбанка: LEON, LOLA и MIRIAM. А японских лишь два: MEIKO и KAITO.
Как же так получилось, что на западе вокалоиды не взлетели от слова совсем?
Тут нам нужно опять вернуться к структуре речи и фонемам. Так уж получилось, что японский язык фонетически гораздо проще английского.
Погнали сравнивать.
Вот японские согласные.
А вот английские согласные.
Вроде бы серьезных различий нет. В японском можно отметить геминацию (удвоение согласных) и назалицию (огнусавливание звуков), но в английском гораздо больше фрикатов, которые, как мы выяснили, трудно корректно синтезировать.
А теперь глянем гласные.
Японские.
Английские.
Да, в английском языке просто огромнейшее количество гласных звуков: 25 против 5. Причем многие из них как бэ являются переходными — такие звуки именуются "дифтонгами". А еще есть "трифтонги".
Это приводит к тому, что произношение в английском языке преднамеренно плавающее. «Нейтив спикеры» могут по-разному артикулировать в произношении одних и тех же слов, заигрывая с фонетикой и подстраивая её под ситуацию, чтобы точнее передать эмоции. Сравните : «Who the fuck are you?» и «Who da fock are you?».
В музыке этим пользуются особенно часто. И потому культура англоязычного исполнения задаёт гораздо более высокую планку для средств синтеза вокала. Англоязычное исполнение изначально гораздо более живое и эмоциональное, чем японское. И чтобы выдать сносное звучание, приходится приложить неимоверно бОльшее количество усилий.
Так как одна нота — один слог на базе одного гласного звука, то запись англоязычного войсбанка и дальнейшая работа с ним в Vocaloid Editor становится крайне трудной задачей. Да, так уж получилось, что музыка строится преимущественно на гласных. И в англоязычном вокалоиде у вас их аж 25 штук, которые нужно правильно подставлять под ситуации. Если в работе с согласными можно ускорить и приглушить их произношение (параметр velocity), а так же срезать верха эквалайзером, чтобы фрикативы ухо не резали, то работать с гласными вам придётся по-честному.
В конечном счете какой-то результат вы все же получите. Но это не то, что могло бы составить хоть какую-то конкуренцию живым исполнителям.
По сему у вокалоидов не было шанса закрепиться на западном рынке. Новые англоязычные войсбанки продолжают выходить, но ни о какой популярности не может быть и речи.
И да, если кто-то потом будет вам заявлять, что в английском языке сложное произношение, то это не бессмысленное нытье неосилятора, а объективная истина в последней инстанции.
3.2 — Привлечение дополнительных издателей
Как-то так получилось, что такая солидная корпорация, как Yamaha, не решилась полностью самостоятельно развивать свой продукт. Было принято решение привлечь сторонние компании для создания дополнительной продукции на базе создававшейся технологии. Подразумевалось, что эти компании будут иметь полную свободу в плане маркетинга, но должны были отчислять проценты.
В 2002 году откликнулась Crypton Future Media (далее CFM) — маленькая компания из Саппоро. Об этих замечательных ребятах мы поговорим поподробнее чуть ниже по тексту. В этом же году были найдены (не без помощи CFM) издатели и для английских войсбанков — британская Zero-G Ltd (выпустившие LEON, LOLA и MIRIAM) и шведская PowerFX. Затем на протяжении длительного времени к вокалоидному бизнесу причащалось множество компаний: 1st PLACE Co, EXIT TUNES, Lawson Inc, We've Inc, Internet Co, AH-Software, Sanrio Co (правообладатели Hello Kitty, кстати), Unity Technologies Japan, Bandai Namco, SEGA, Sony Music Entertainment и многие другие. Полный список компаний, которые шли на сотрудничество с Yamaha, огромен. И у каждой были свои войсбанки, свои виртуальные айдолы.
Кстати, сама Yamaha так и не смогла заиметь сколь-либо популярный войсбанк.
3.3 — Crypton Future Media
Заранее напишу, что половина успеха бренда vocaloid заключается в грамотной работе вот этих ребят.
Сотрудничество Yamaha и CFM началось с того, что первая передала второй права на издание MEIKO и KAITO. Да, как таковые войсбанки были созданы самой Yamaha.
Что с ними решила сделать CFM? Ну, во первых, сбацать им антропоморфизмы. На скорую руку. Вот эти.
Продажи в целом оказались удовлетворительными: хорошие у MEIKO и плохие у KAITO. В то время для окупаемости записи войсбанка достаточно было продать 1500 копий софта. Мейко выдала нужное количество за первый месяц, Кайто сделал лишь 500 проданных копий за это же время.
Но нужно было идти дальше. Тем более, на подходе была следующая версия движка — VOCALOID2. Для неё была запланирована целая серия войсбанков — Character Vocal Series.
По словам Ватару Сасаки, они планировали сделать не просто музыкальные инструменты с нарисованной на упаковке картинкой человека. Они планировали сделать полноценные личности. С характером и предысторией. А так же очень хорошо проработать дизайн, сделать его ярким и узнаваемым.
Для разработки дизайна был привлечен сторонний профессиональный художник — KEI. В быту, если гугл не врёт, именуемый как Кей Гаро. Хотя это довольно сомнительно, так как "Гаро" (画廊) просто переводится как "галерея".
CFM поставила перед художником задачу — нарисовать человекоподобный синтезатор. Эдакого андроида, специализирующегося на работе с музыкой. Не смотря на сложности с пониманием задачи (художник никак не мог взять в толк, как же нарисовать "поющее человекоподобное устройство") результат был готов спустя месяц.
Судя по всему, первые арты создавались вручную, акварелью, по бумаге. А не в этих ваших современных фотошопах и иллюстраторах.
В качестве «вдохновения» был взят дизайн синтезаторов Yamaha DX7 и DX100.
В остальном же остаётся куча вопросов, как художник смог додуматься до выбора столь могучих фансервисных элементов. Тут тебе и причёска с длиннющим двойным хвостом (т.н. «twintail»), и «zettai ryoiki» (чулки до середины бедра, выглядывающие из-под юбки). И все это поверх образа девочки-школьницы, которой, судя по легенде, придуманной Ватару Сасаки, всего лишь 16 лет. Впрочем, судя по информации из интервью, художник изначально делал два эскиза с разными версиями: с одним хвостом и двумя. В таком случае отдельное спасибо Ватару Сасаки, что выбрал второй вариант.
Позже этот же иллюстратор создавал дизайны и для других войсбанков этой компании (СV02 и СV03). Но превзойти свой первый шедевр не смог.
Далее последовал следующий маркетинговый шаг от CFM, от которого отаку не смогли устоять — компания начала бомбить общественность изданиями журналов с изображениями Мику и демо-версиями с её голосом. Шишка у людей дымилась от одного только вида обложки.
Ах да, забыл еще вот что указать. Имя было взято не от балды. Официально оно переводится как "Первый звук из будущего". 初 ("хатсу") — первый, 音 (в данном случае читается как "нэ") — звук. С именем посложнее. Записано оно катаканой (ミク), а не кандзи или хираганой. Как будто это иностранное слово. И считается созвучным (схожим по написанию?) японскому слову "мираи" — будущее. Какая-то трудноописуемая культурная особенность японцев. Как бы то ни было, эксплуатация научно-фантастической эстетики шла полным ходом. Что лишь способствовало популяризации и маркетингу.
Итак, Хатсунэ Мику вышла в свет 31 августа 2007 года. Она стала первой в линейке Character Vocal Series (CV01) и, в конечном счёте, самым популярным вокалоидом, сделав успех всему бренду vocaloid.
А ещё одним из подтверждений того, что 2007 — лучший год за всю историю человечества.
Часть 4 — Распространение и влияние
Не рекомендую читать данный раздел, если вы заядлый фанат творчества на основе предмета статьи. Пройдите мимо, здесь не будет ни единого грамма новой информации для вас. На вас и так уже достаточно повлияли, так сказать.
Первое представление о войсбанке получили профессиональные музыканты — читатели журнала DTM (Desktop Musican Magazine). Пример того самого первого издания вы уже видели на картинке выше — крайняя левая верхняя. Поэтому ЦА продукта всё же смогло использовать войсбанк по назначению, а не просто смотреть на красивые картинки. Первые примеры творчества выкладывались на японский аналог ютуба — NicoNicoDouga. Ныне забаненная роскомнадзором организация на территории РФ.
Кстати да. А лично ТЫ сможешь пробиться через фекальный фаерволл и прикоснуться к ТОМУ самому историческому контенту? Проверь себя! И свой ВПН.
С тех пор почти весь контент с вокалоидами выходит в первую очередь на нико, а уже затем дублируется (зачастую фанатами) на ютубе. Вполне возможно, что контент с вокалоидами — единственное, благодаря чему NicoNico до сих пор существует. Не было бы вокалоидов — не было бы у японцев своего локального ютуба.
Ладно, не мучайтесь. Вот вам ссылка для простых смертных.
В феврале 2008 года вышел MikuMikuDance (сокращенно MMD) — 3D редактор для создания анимаций и клипов к музыке. Примечательно, что создал её по сути один независимый разработчик — Ю Хигучи. Никаких корпораций и компаний за этой мощной софтиной не стояло. Правда исходный код он так и не опубликовал, засранец. Ограничился лишь freeware лицензией.
Пользователи, разумеется, использовали его не только по назначению, но и для клепания контента на порнохаб.
В июле 2009 вышла первая игра франшизы Project DIVA. Под издательством великомученной SEGA. К сожалению, я не смог найти какую-либо информацию о том, как CFM и SEGA к такому пришли. Идея отменная, но автор статьи так и не смог поиграть и оценить.
22 августа в 2009 году в Токио состоялся первый концерт. С тех пор прошло уже множество десятков концертов по всему миру. В рамках "HATSUNE MIKU EXPO 2016 NORTH AMERICA" концерты прошли по всем крупным городам материка: Лос-Анжелес, Нью-Йорк, Чикаго, Сиэтл, Хьюстон, Торонто, Мехико. Так же были концерты в Китае, Сингапуре, Тайване, Индонезии — да почти во всех странах дальне-восточного региона.
Стоит отметить, что эти концерты были интересным представлением с точки зрения того, что впервые за историю живые люди играли на инструментах для виртуального исполнителя. Это одновременно впечатляло и пугало. Казалось, будущее и впрямь наступило. То самое «Magical Mirai».
Большой вклад в качество этих концертов внесли ребята из группы Supercell и лично лидер группы Ryo. Именно они играли живую музыку на концерте искусственного исполнителя.
Можно ли себе представить концерт без подобного аккомпанирования? Конечно можно. Для этого можно вспомнить представление на разогреве у Леди Гаги. В конечном счёте, без людского присутствия на сцене, это просто голограмма. Пучок света, проецируемый на стекло. Не более. И результат получается довольно кринжовый. Да и сам факт того, что и без того знаменитая на весь мир артистка пытается добиться ещё большей популярности через такой вот халтурный "коллаб" — тот ещё кринж.
Ах да, так как права на игры по франшизе принадлежат SEGA, то та не преминула использовать вокалоидов в своей MMO Phantasy Star Online 2.
Так же стоит отметить франшизу Black Rock Shooter, родившуюся по сути из одной картинки художника Huke, по мотивам которой Ryo и Supercell написали песню и опубликовали в середине 2008 года.
Далее при участии Huke был сделан клип на одноименную песню, а после и 50-минутная OVA. А после и полноценный ТВ-сериал с опенингом с применением голоса Мику. А так же игры, манга и куча другого стаффа. Сериал, кстати, советую глянуть, если еще не смотрели. Не то чтобы оно 10/10, нет. Просто там очень клевая амосфера, экшн и чардиз. И да, это по сей день один из лучших примеров грамотного использования 3D в аниме.
Сама же BRS стала одним из многочисленных альтер-эго Мику. А предмет статьи показал и доказал, что с его помощью нестыдно делать контент не только для интернета, но и для телевещания.
Можно так же вспомнить Mekakucity Actors. Тайтл, в котором сюжет строился на основе вокалоидных песен автора — Дзина.
Вообще создатели аниме-контента любят постоянно отсылаться к теме вокалоидов. Вот один добр человек с ютуба сделал подборку за меня.
На этом я, пожалуй, остановлюсь. Влияние вокалоидов огромное и перечислить вот прям совсем всё абсолютно невозможно. Они дали толчок в развитии виртуальному блоггингу и витьюбингу, породили жанр додзинси музыки и додзинси 3D анимации. Почти всё, что связано с современной Японией, теперь несёт на себе отпечаток феномена вокалоидов. И в первую очередь — отпечаток образа Мику Хатсуне.
И в то же время я советую вам постоянно держать в голове тот факт, что Мику Хатсуне не имеет прямого отношения к Yamaha и ее проекту Vocaloid. Это просто голосовая библиотека, расширение для синтезирующего движка. Сделанное отдельной компанией. Что, в свою очередь, имеет огромное юридическое значение. В дальнейшем мы вернемся к этой теме.
Часть 5 — Примеры вокалоидов
В данном разделе я пройдусь по наиболее популярным и значимым вокалоидам (на мой скромный вгляд). А так же добавлю примеры звучания, распишу вкратце историю создания и добавлю информацию о голосовых провайдерах (народ должен знать своих героев в лицо).
Отмечу, что искать контент по ютубу крайне проблематично. Пользователи выставляют контент из расчета не на качество голоса и музыки, а на содержимое в видеоклипе. Потому контент буду брать с прицелом на свою накопленную дискографию, собранную из обрывков дисковых альбомов, которую собирал с 2012 по 2018 год. Авторство будет указано в описании, так вы сможете найти еще больше похожего контента. К тому же это задел на будущее, так как контент с ютуба имеет свойство пропадать, а так его можно будет потом хотя бы по описанию найти.
И да, написать всё обо всех категорически невозможно. Ибо более-менее известных вокалоидов десятки, а всего их больше сотни.
Сначала разделим по целевым языкам и далее буду отчитываться по хронологии появления на свет.
5.1 — Японские
MEIKO
Издатель — Crypton Future Media
Дата выпуска — 5 ноября 2004 года
Один из первых вокалоидов и самый первый японоязычный. После выхода V2 и Character Voice Series её популярность сильно упала и с тех пор качественного контента с этим голосом почти не выходило. Даже после перезаписи войсбанка для V3. Пример будет один. На этом и остановимся.
KAITO
Издатель — Crypton Future Media
Дата выпуска — 14 февраля 2006 года
Не смотря на традиционно сомнительное качество войсбанков, Кайто большую часть времени был весьма популярен. Так как во многих случаях авторам нужен был хоть какой-то по-настоящему мужской (а не мальчишеский) голос. У CFM он такой был и есть только один. И так как CFM это мастодонт вокалоидного маркетинга, то Кайто держится и хоть как-то, но существует — остальные более популярные войсбанки тянут его за собой. За провальный релиз во времена V1 он вполне отыгрался после переиздания на V3.
Вообще довольно сложно понять, почему войсбанк Кайто оказался таким неприятным по звучанию. Можно сделать предположение, что человеческий слух в принципе нацелен на восприятие низких и средних частот. И потому он хорошо различает фальш в этом диапазоне. Однако эта версия несостоятельна, так как позже вышли другие мужские войсбанки с более сносным звучанием.
Hatsune Miku
Издатель — Crypton Future Media
Дата выпуска — 31 августа 2007 года
У некоторых может вызвать раздражение, что эта статья более чем на половину состоит из упоминаний Мику, а так же контента с ней. Хотя я изо всех сил стараюсь разнообразить наполнение статьи. Только это все равно бессмысленно. Мику — самый популярный войсбанк у музыкантов и самый популярный образ у художников. И как итог — самый популярный персонаж у аудитории. Как говорится, "We live in society", все дела.
Если же абстрагироваться от внешности, которая для музыканта не важна, то нужно обратить внимание, что голос был подоробран более чем грамотно. Был взят высокий образец со специфичным тембром, с нотками детской наивности. Далее вы поймете, почему это оказалось важно. И нет, не только потому, что вокалоиды отрабатывали аниме-эстетику, где персонажей принято изображать детьми.
Kagamine Rin/Len
Издатель — Crypton Future Media
Дата выпуска — 31 августа 2007 года
Количество женских войсбанков росло и CFM нужно было как-то компенсировать это. В какой-то момент Ватару Сасаки пришла идея сделать 2 войсбанка на базе одного голоса — мужской (голос подростка) и женский. Для этих целей специально пригласили человека, способного воспроизвести два голоса в разной тональности. Причём в маркетинговой компании войсбанк рекламировался как 2 по цене одного. К сожалению, CFM не смогла выдать сносное качество сразу двух голосов на старте и потому пришлось делать переиздание на актуальной версии движка в 2008 году.
Изначально оба персонажа задумывались как близнецы. Но в какой-то момент CFM надоели различные вариации шиппинга персонажей и теперь они официально и не близнецы, и не любовники. CV02 означает, что они оба вторые в Character Vocal Series после Мику.
Camui Gackpo
Издатель — Internet Co
Дата выпуска — 31 июля 2008
Наконец-то в гонку стали подключаться другие японские издатели.
Судя по всему, при создании войсбанка было решено сильно облегчить работу и записать голос в более высоком регистре. Весь басовитый оригинальный окрас голоса с кучей сложных гармоник улетучился, но конечный результат всё равно лучше, чем в случае с Кайто. Это и по сей день один из лучших мужских войсбанков, если не лучший. Но почему-то не очень популярный. А разгадка одна — недостаток маркетинга со стороны издателя.
Megurine Luka
Издатель — Crypton Future Media
Дата выпуска — 30 января 2009 года
В какой-то момент CFM запланировали сделать англоязычный войсбанк и им нужен был человек, который хорошо владел английским. Саки Фуджита на тот момент лишь начинала осваивать английскую фонетику. В итоге пригласили Ю Асакаву, которая на момент записи была флюент спикером. Полученный вокалоид стал третьим в Characte Vocal Series (CV03) и первым билингвиальным.
Лука считается самым простым в тюнинге войсбанком, к тому же многие выбирают её, если им по каким-то причинам не охота работать с нарочито «писклявым» анимешным голосом.
Проблема в том, что любой "не писклявый" войсбанк априори звучит неубедительно после синтеза. Потому что одно дело — малоэмоциональный, аутичный голос маленькой девочки. С неразвитой психикой и не имеющей жизненного опыта. Другое дело — взрослая женщина, которая обязательно должна давить харизмой. Чего голосом Луки достаточно трудно добиться по причине слишком спокойного тембра.
И да, лучше даже не пытайтесь гуглить примеры работы английской версии.
GUMI
Издатель — Internet Co
Дата выпуска — 26 июня 2009 года
Крайне удачный выбор с точки зрения маркетинга. Всем известный персонаж, известный своей вокальной специализацией — теперь и у тебя в компьютере, делай с ним что хочешь. Визуальный дизайн так же делает необходимые отсылки. Как итог — один из самых популярных вокалоидов из тех, что не издаются CFM. В большинстве статистических подсчетов — вообще второй после Мику. Правда с многократным отставанием.
В плане голоса получилось нечто среднее между Лукой и Мику: не такой писклявый, но и не такой отрешенный. Да и передан он замечательно.
К сожалению, найти нормальных перепевок я так и не смог. Потому делать сравнение в лоб не получится.
Yuzuki Yukari
Издатель — AH-Software
Дата выпуска — 22 декабря 2011 года.
AH-Software Co уже успела засветиться созданием схожего с vocaloid софта — они делали voiceroid, продвинутую говорилку с дополнительным маркетингом в виде аниме-персонажей. В какой-то момент они решили заняться эдаким кроссмаркетингом, выпустив один войсбанк сразу на двух платформах.
Так как речь идёт чисто о сейю, то никаких примеров вокала не будет. Просто примите на веру то, что разница между войсбанком и голосом провайдера в данном случае минимальна.
Не смотря но схожесть по тембру с Лукой, создателям удалось добиться очень интересного эффекта. Её голос не звучит пришибленным и аутичным. Он скорее безразличен ко всему окружающему. Так или иначе, качество войсбанка получилось просто потрясающим, но очень немногие продюсеры захотели попробовать поработать с ним.
Но тут нужно заранее отметить, что мы ступаем на территорию третьей версии программы. Вполне возможно, что инженеры из Yamaha наконец-то смогли реализовать все необходимые алгоритмы, чтобы внятно сводить фонемы.
IA
Издатель — 1st PLACE Co
Дата выпуска — 27 января 2012 года
1st PLACE — очень маленькая компания, по сути просто небольшой локальный лейбл, известный тем, что издавал музыку авторства Дзюна Маэды — композитора и сценариста этого нашего Angel Beats.
В какой-то момент они решили ворваться в вокалоидный бизнес и взяли за образец знакомый голос знакомого исполнителя (мозаика складывается прямо на глазах).
Топ тир исполнителя, певца из множества опенингов и эндингов к аниме.
Однако в данном случае это уже не имеет значения. Как бы это иронично не звучало, но 1st PLACE в вокалоидном бизнесе далеко не первые. Время упущено. Все сливки с потенциального рынка давно уже собрали CFM. Сколько денег в маркетинг не вкладывай, первым ты уже не станешь.
Отмечу, что для своего старта они специально наняли очень опытного, хорошо зарекомендовавшего себя в тюнинге голосов автора. Любой другой музыкант такого результата с ходу вот просто так не получит.
Aoki Lapis
Издатель — Bplast
Дата выпуска — 6 апреля 2012 года
Bplast уже были известны тем, что издавали безымянных вокалоидов по заказу Yamaha (VY1 и VY2 — о них мы не будем говорить). В этот раз они решили выпустить чисто свой продукт, вложиться в дизайн и найти подходящий голос через конкурс на NicoNico.
Издатель так же прорабатывал описание персонажа: типа это маленькая фея, способная преобразовывать силу пения в жизненную энергию и прочие уже мало кому интересные детали. Такая вот попытка скопировать маркетинг у CFM.
К чему я это всё? Да к тому, что подобных вокалоидов, на которые было потрачено куча усилий, было дохрена. И подобные конкурсы среди простых смертных проводились довольно часто. Результат мог быть сколько угодно сносным. Но было уже поздно.
MAYU
Издатель — EXIT TUNES
Дата выхода — 5 декабря 2012 года
EXIT TUNES были известны тем, что издавали очень годные сборники вокалоидных песен. По сути это был лейбл. В какой-то момент и они решили обзавестись вокалоидом, а то чё как лохи.
Довольно странно, но в моей дискографии довольно много контента с её голосом. Возможно это потому, что я слишком часто слушал сборники EXIT TUNES в поисках годноты. Ну и они как бэ не могли лишний раз не пропихнуть своего вокалоида.
5.2 — Английские
С вашего позволения, я сильно сокращаю количество упоминаемой в описании вокалоидов информации. Можно? Спасибо. Иначе эта статья своим размером пробьет дыру в ад.
К тому же инфа о неяпонских вокалоидах крайне неструктурирована, ее очень трудно искать. Да, я просто решил облегчить себе работу.
miriam
Войсбанк на основе голоса популярной поп-певицы — Мириам Стокли. Всю дополнительную инфу сами нагуглите, не маленькие. Отмечу лишь то, что со времен первого релиза никаких переизданий не было. Войсбанк звучал так себе и до сих пор звучит так же. Пример звучания авторства Майка Олдфилда можете послушать в самом начале статьи. Больше ничего не будет — поберегу ваши уши.
SweetAnn
Ну что тут можно сказать. Первый вокалоид для версии V2 (вышла раньше Мику). Перевыпуска на новые движки не было. Имя представляет из себя забавную анаграмму: Sweet-Ann — Swe-den, намекая на место проихождения.
В остальном вполне себе сносный даже по нынешним меркам англоязычный войсбанк. Всё равно они никогда не звучали хорошо и никогда не будут.
avanna
Пожалуй, единственный популярный англоязычный вокалоид с достойным звучанием.
RUBY
Перед выходом V4 были очень большие надежды на то, что этот войсбанк преодолеет сложность английской фонетики. Чуда не случилось. Во всяком случае массового наплыва годного контента на ютьюб обнаружено не было.
5.3 — Испанские
Он в нашей статье будет всего один. Но зато КАКОЙ.
MAIKA
Помните, с чего начиналась статья? Барселона, MTG, Жорди Бонада? Нихрена вы уже не помните. А тем временем этот самый Жорди Бонада отделился от MTG и вместе с другими бывшими сотрудниками основал свою компанию — Voctro Labs. И конечно же они решили сделать вокалоида на понятном им и их соотечественникам языке. А еще и для большей части Латинской Америки, кстати.
Кто-то может подумать, да нахрена испаноговорящим людям свой вокалоид? Они что, аниме смотрят и вокалоидов слушают? Представьте себе, ДА!
Google Trends демонстрирует крайне высокую заинтересованность испаноязычной аудитории по запросу Vocaloid. Да и аниме они тоже смотрят, на ютубе постоянно можно наткнуться на аниме-контент с испанскими субтитрами, а на глобальных торрентах — раздачи с испанскими субтитрами.
Так что данный вокалоид вполне себе пришёлся кстати. А Жорди Бонада огромное спасибо, что благодря ему вокалоиды смогли сносно запеть хоть на каком-то европейском языке. Войсбанк получился потрясающего качества. Судя по всему, испанский оказался очень близок фонетически к японскому и это так же сыграло свою роль.
Забавно, но теперь получается, что вокалоиды могут петь опенинги не только для аниме, но и для мексиканских и бразильских сериалов. Жаль прецедентов не было.
5.4 — Другие языки
Тут у меня начинаются серьезные пробелы в осведомленности. Я точно знаю, что как минимум есть корейские и китайские. Но все они либо крайне непопулярны, либо звучат отвратительно.
Печально, что русского языка даже в проекте не было. Потому приходится довольствоваться чем-то подобным, где наши соотечественники пытаются выдавить из японского войсбанка хотя бы малость понятный русский язык.
Часть 6 — Разнообразие жанров
Здесь мы попытаемся рассмотреть разные варианты применения вокалоидов в разных жанрах. Заодно пополним запас хороших, годных музыкальных продюсеров. Существует стереотип, что вокалоиды преимущественно про J-pop и J-rock. Формально это так, но лишь потому, что страна происхождения на J. В других жанрах музыку тоже иногда делают.
В околооперном и фолковом пении всё достаточно гладко. Вокалоиды без проблем берут высокие ноты, делают своим голосом сложное вибрато и вообще жаль, что среди продюсеров мало людей, желающих работать в таком направлении.
С исполнением в джазовой манере всё намного печальнее. Опять же, никаких трудностей, главное — желание. На примерах выше с Yuzuki Yukari вы могли убедиться, что качество такого контента может быть потрясающим. Хотя да, крайне желательно, чтобы тембр голоса был пониже и повзрослее. Но и в ином случае получается неплохой результат.
Репчик крайне малопопулярен в Японии и мало кто из вокалоидных продюсеров попытался затюнить что-то убедительное. К тому же программа не предназначена для создания разговорного контента и речетатив воспроизводится гораздо сложнее, чем хотелось бы. Все интонации надо расставлять вручную. Тот самый случай, когда приходиться смириться с мыслью о том, что речетатив — это тоже пение.
Под электронику вокалоиды ложатся идеально. Холодный, безэмоциональный голос, без проблем при этом берущий высочайшие, недостижимые для живого человека ноты. Прекрасно подходит под саму эстетику синтезированного звука. Ну а там, где не удалось нормально затюнить голос и начали вылезать артефакты, можно просто замаскировать всё кучей фильтров, будь то хорус, реверб или дисторшен.
Отдельно хотелось бы вернуться к теме рок-музыки. Она всё же разная бывает, не только J-rock.
К сожалению, но подобие хард-роковой манеры с рычанием или гроулом вокалоиды выдать не могут. Максимум — нечто кринжовое наподобное того, что ниже. Зато кое-какая другая программа могёт, о ней мы позже поговорим.
Так же вокалоиды хорошо стыкуются с плотным, нойзовым гранжевым звучанием гитары. Артефактов звучания просто не слышно за стеной из звука.
По поводу гроула. Поразительно, почему Yamaha до сих пор не соизволила добавить что-то внятное для этого. Вроде как в V4 появился отдельный параметр для этого. Но результат смешной. В итоге авторам приходится идти на разные выдумки и костыли из множества фильтров.
Либо не выпендриваться и просто делать душераздирающий альтернативный металл под пришибленный детский голос.
В заключение этого раздела скажу, что годных и разнообразных исполнителей много. Но посредственных гораздо больше. И фильтровать весь этот поток контента ну очень выматывает. По сему я бросил этим заниматься и нового почти не ищу. Весь контент выше можно считать чем угодно: кто-то назовёт это классикой, а кто-то скажет, что это неактуальное старьё. Для меня же это мой личный золотой фонд.
Часть 7 — Аналоги
Так как нам интересно, с чего всё пришло и куда движется, придётся глянуть на примеры аналогичных софтин. На их примерах можно будет многое понять.
Cantor
Начать стоит с этой программы. Вышла в 2004 году и умерла спустя 3 года. Многие её в своё время сравнивали с Vocaloid. Принцип синтеза совершенно другой и основан не на сэмплировании, а на воспроизведении фонем по спектру. Практика показала, что такой вариант даёт результат намного хуже. И не просто хуже, а натурально криповее.
UTAU
Главный конкурент вокалоидов большую часть времени. Принцип работы абсолютно идентичен. Была написана одним человеком на вижуал бэйсике в 2008 году и последний раз обновлялась в 2013, но музыканты до сих пор с ней работают. Распространяется по модели shareware, то есть бесплатно. Для огромного множества людей это огромный плюс.
Особенно примечательна тем, что абсолютно любой пользователь может записать свой войсбанк (для разделения их именуют утаулоидами). Но из-за того, что алгоритмы кроссфейда и питч шифтинга у программы уступают по качеству вокалоидным, звучание почти всегда слегка металлизировано, даже безотносительно артефактов на фрикативах и потому уступает вокалоидному. С другой стороны, можно расширить возможности тембра, добавляя свои аппенды войсбанков. И имитировать гроул со скримингом, например.
В принципе эта штука заслуживает целой отдельной статьи примерно такого же размера. Чего я делать уже не буду. Просто вброшу несколько примеров звучания. Так же отмечу, что количество контента с утау стремится к бесконечности и структурировать его крайне проблематично.
Можно даже заставить программу петь на русском языке. Но ради хоть какого-то результата придется много потеть.
CeVIO
Синтезатор вокала, который вырос из программы-говорилки. В остальном полностью идентичен. Имеет те же минусы и те же плюсы, разве что разговорный контент даётся ей чуть лучше. Количество войсбанков пока небольшое. В июне 2018 была совершена миграция IA на этот движок, миграция Yuzuki Yukari планируется в этом году. В январе-марте этого года должна выйти проапгрейженная версия, работающая с применением алгоритмов машинного обучения. Ждём. А пока что оно звучит так, как на примерах ниже.
Кстати, на этом движке есть французский войсбанк, но я вам его не дам послушать, потому что оно вам не надо, поверьте на слово.
neutrino
Эта штука работает уже принципиально по-другому. Тут уже всё по последнему слову техники, прямо здесь и прямо сейчас. Новое поколение синтезаторов принимает свой пост.
Неплохо было бы эту программку потыркать самому для получения представления о том, что и как там работает. Но времени пока что не было.
Вообще им срочно нужно что-то делать с неймингом и брендингом. Потому что гуглить такое название крайне проблематично. Назвали бы neuroid или neuloid хотя бы.
Часть 8 — Грустное настоящее и сомнительное будущее
Эта статья приближается к концу и пора начинать подводить итоги.
Вокалоиды проделали огромный путь, но рано или поздно любой тренд, любая вещь, любое явление умирает, растворяется, исчезает. Сама суть виртуального идола на данный момент почти исчерпала себя. Не то чтобы нужно ставить крест на подобном феномене, нет. Просто нужна подпитка новыми технологиями и идеями. Нельзя вечно бросать деньги в маркетинг и раскрутку одного и того же, рассчитывая на то, что так будет вечно. У программы начинают появляться серьезные конкуренты, но Yamaha практически ничего не делает для того, чтобы сделать свой софт принципиально качественнее по звучанию и удобнее для пользователя. Алгоритмы и принцип работы по большей части остаются те же.
Само собой, что-то Yamaha делает, но не там и не туда. Да, они тоже работают с машинным обучением, но не в направлении улучшения существующего софта. Они творят хрен пойми что. Восстанавливают голоса каких-то уже давно умерших японских певиц и всё такое.
Одна из последних новостей вообще заключается в том, что Crypton Future Media собирается уйти с движка Vocaloid на свой собственный под названием PiaPro. То есть в какой-то момент Мику в принципе может перестать официально называться вокалоидом. Хотя стоп, уже перестала. Обновления под V5 нет и не будет. Всё, ваш любимый вокалоид теперь не вокалоид.
На что рассчитывает Yamaha с таким подходом? Неужели они не видят ЭТО?
Да, пик популярности уже давно прошёл. Теперь популярность в основном только падает. Вокалоиды на наших глазах перестают быть будущим. И становятся прошлым.
Но даже если кто-то сможет совершить революцию в синтезе, сможет ли этот кто-то совершить революцию в дизайне и маркетинге? Сможет ли он создать новые образы, от которых у мужской половины отаку шишка встаёт колом, а у женской возникает непреодолимое желание натянуть на себя косплейный костюм?
Я по жизни сраный пессимист и автоматом отвечаю — НЕТ, не смогут. Те же цевио и нейтрино могут звучать бесконечно прекрасно, но им никогда не превзойти Мику с ее длинными хвостиками. А если кто-то и попытается, то получит повестку в арбитражный суд за плагиат.
Часть 9 — Заключение
Я думаю, что никто не будет спорить, что данный феномен мог зародиться исключительно в стране восходящего солнца.
Причин этому несколько:
— Особенности японской культуры. Японцы склонны одушевлять объекты рукотворного происхождения. Будь то робот, программа, а то и вовсе авианосец.
— Особенности японского языка. В частности простая фонетика. Сама речь по сути разбита на слоги, которые удобно читать при музыкальном исполнении и записывать при редактировании песен. Каждому слогу соответствует иероглиф хираганы, который в редакторе соответствует исполняемой ноте. Отчасти по этой же причине японцы смогли в караоке.
— Технологический и экономический уровень развития страны. Далеко не каждая корпорация далеко не каждой страны способна инвестировать в развитие подобной продукции.
И по сему не имеет значения, сколько времени и сил вы вложите в разработку подобного софта на английском или любом другом языке. Yamaha потратила на это огромное множество сил и времени, но не добилась практически ничего, кроме базовой окупаемости. Весь успех был осуществлен другой компанией, работавшей на родном, понятном ей рынке.
В остальном же это потрясающий пример, в котором софт для профессионалов продвигался с использованием очень мощной маркетинговой кампании, базировавшейся на аниме-эстетике. И что-то мне подсказывает, что такое может больше не сработать. Как минимум нужно время, чтобы человечество отдохнуло от этой темы. И тогда можно попытаться снова. Либо нужен очень мощный скачок в технологиях, который позволил бы генерировать примеры текстов и песен с музыкой нажатием одной кнопки. Прямо как та же AIVA или Mubert, только с голосом. И с танцами. А ещё чтобы тембр голоса и образ персонажа генерировались уникальные…
Эх, мечты. И ведь это по-любому когда-нибудь случится. Скорее всего даже на моём миллениаловском веку.
Ну а пока что у человечества есть витьюберы, голос которых не надо синтезировать — он и без этого уже есть.
Ссылки на источники информации
Фанатская википедия. Куда нынче без них. Русскоязычной пользоваться не рекомендую — там лютый гуглоперевод.
Огромная база данных практически обо всех исполнителях, альбомах, песнях и так далее. Очень помогает ориентироваться во всей этой бездне контента.
Ресурс, где народ обменивается альбомами с музыкой. Даже не знаю, можно ли его считать пиратским. Пусть в любом случае будет.