Знаете, у меня есть мечта

Для которой я слишком занят, чтобы её осуществить

Знаете, у меня есть мечта

Вообще, у меня много мечт. Но эта не такая большая и не такая напряжная, на неё придётся убить ну максимум пару месяцев (хотя знаю я эти пару месяцев, как всегда всё растянется на пару лет). Тем грустнее, что она так и лежит в задворках сознания и не находит никакой реализации, в ожидании чего-то... чего?

Ввожу в курс дела

Я, признаюсь, буквально влюблён в серию Nier. Атмосфера в игре такая одинокая и безрадостная, что я буквально чувствую себя там как дома. А сюжетная линия, базирующаяся на конфликте главного героя и самой природы вещей, где в конце концов главный герой берёт на себя роль чужеродного разрушителя, абсолютного зла, вдохновляет и даже заставляет меня бесконечно совершенствоваться в своих трудах. Но сегодня не об этом (и никогда об этом, ненавижу свои переживания расписывать).

Не менее, а может даже и более искуссным, мне видится саундтрек к серии игр. В своё время я ставил пятичасовое видео с саундтреком Nier: Automata на фон и переслушивал сутками, не в силах остановиться. Дважды признанный лучшим саундтреком года, именно он добавляет наибольший вклад в атмосферу, сглаживая все огрехи геймдизайна и левелдизайна.

Основным автором саундтрека для обоих игр (ну и для Drakengard 3) является Кеичи Окабе, владелец студии Monaca. За свою долгую карьеру длинной в пару десятков лет он успел много где засветиться, возможно он даже помогал сочинять музыку для вашего любимого аниме.

Вместе с ним в качестве основной вокалистки и сочинителя текстов над саундтреком работала Эми Эванс, певица английского происхождения, живущая в Японии. Помимо нежнейшего голоса, сопровождающего нас на протяжении всей игры, она отдельно создала какое-то подобие нового языка, на котором поётся большая часть песен в саундтреке. Для этого она переслушивала песни на многих языках (но в основном на японском и европейских), стараясь находить в них какие-то интересные особенности и соединяя их воедино во что-то новое и неизведанное, но в то же самое время очень знакомое слуху.

Для использования этого подхода у авторов было две причины. Первая - сугубо техническая, чтобы саундтрек, который должен был звучать на протяжении всей игры, не отвлекал от основных диалогов персонажей. И правда, сложно отвлечься на что-то, что не является настоящим языком и чего ты не понимаешь. Второе же - сугубо сеттинговое. Действие игры разворачивается на несколько тысяч лет позже уничтожения человеческой цивилизации, и авторам хотелось передать язык будущего, чего-то, во что трансформируется наша речь через тысячу лет.

Вот вам для примера песня и её текст:

Shul parel moihim

Ar, jaruk noisin

Dah galach dalfouir

Malech foir dir azlad erenj boir

Hiuo tantiera hadreikun harech falale ya boi

Hiuo migenda yakachren nohei kaine rekara

Hiuo tantiera hadreikun harech falale ya boi

Hiuo migenda ya kochren nohei yalma

Tei koimiren tara bairatru

За три игры Эванс успела сочинить несколько десятков таких текстов. Все они, конечно, написаны на ненастоящем языке и никакой консистентности в этих текстах нет, использование букв и звуков в них совершенно утилитарно. Тем не менее, там всё таки есть какая-то статистика использования последовательностей звуков. И это можно использовать...

Суть моих мечтаний

Я хочу написать формат обмена данных на основе этих текстов. Для этого мне нужно написать шифратор, который будут трансформировать любой заданный текст (ну или json, например) в стихи на этом языке будущего, причём так, чтобы текст можно было однозначно расшифровать, имея на руках ключ.

Как это сделать? Ну, у меня есть некоторые идеи по этому поводу, но общего понимания нет.

Во-первых, нужен генератор стиховой формы. Тут уже есть наработки, их достаточно. Другой вопрос, смогу ли я воспроизвести на своём старом компьютере. Я в нейросетях слабоват, у меня редко что получается связанное с ними. Вот, в этой статье используют LSTM - и результаты вдохновляют. Но мне будет легче, потому что я хочу обучать нейросеть не на стихах, а на формах стихов, то есть последовательность таких данных:

ууоОяУзЁы

ааяЕаУеО

иЁиОюОуЁы

ёОиОеиУо

Выше, если что, вступление в "Лукоморье" Пушкина, где заглавная буква - ударный слог, а строчная - безударный.

Во-вторых, теперь, когда у нас есть стиховая структура, мы можем её заполнять данными. В самом простом случае (который мне не очень нравится, хочется чего-то более элегантного и соответствующего оригинальной языковой структуре), мы можем взять все используемые согласные и их комбинации, которых накопится пару десятков, плюс пробел и запятая, перемножим на количество используемых гласных и у нас появляется около 100 битов на слог, что позволяет нам закодировать 100 символов. Этого хватит на ASCII! Дальше уже можно подключать любые другие кодировки, меняя количество используемых слогов на один символ, и зашифровывать эту информацию где-то в начале стиха (а может лучше в его названии?).

Ну и в-третьих, нужно генерировать всю эту информацию с минимальным шифрованием, чтобы соответствия "слог -> символ" выбирались в зависимости от ключа. Тут никаких особых проблем не должно быть, не буду описывать.

Есть у всего этого как плюсы, так и минусы. Главный минус в том, что количество информации в среднем будет увеличиваться в пять раз: на каждые 10 символов исходных данных придётся 50 символов стиха. Это оооочень много. Но с другой стороны, должно получиться красиво. И не очень легко расшифровать (хотя, конечно, в течении 10 минут это можно будет расшифровать без ключа на любом современном ПК).

Ну, обычно в конце таких статей требуется написать какое-то заключение. Но я понятия не имею, что сюда писать. Всем спасибо за внимание, буду и дальше стараться писать уникальный качественный контент длинной более 2к символов.

1212
Начать дискуссию