4 мысли о AI генераторах картинок типа DALL-E 2 и MidJourney, от разработчика игр
Уже месяц как я получил доступ к MidJourney, сервису который рисует картинки по описанию используя нейросети, и хотел поделится парой мыслей, как каким выводам я пришел после изучения.
Мысль 1: «AI не создает ничего “нового”, но это не проблема»
AI по сути комбинирует уже существующие картинки создавая из них новые комбинации, что на бумаге может звучать как недостаток, «не способен создать что-то новое, может только паразитировать на существующем». Однако наш мозг работает точно так же, мы тоже способны лишь комбинировать уже существующее, главное преимущество AI в том что с этой задачей он справляется гораздо быстрее и нагляднее.
Мысль 2: «No One's Ever Really Gone».
Мобиус, Гигер, Бексинский и многие другие знаковые фигуры мира визуальных искусств продолжают «работать» после смерти, благодаря AI. Конечно же важная ремарка, скорее их «образ» продолжает работать, если живой Гигер вдруг решил бы отойти от привычного стиля, в поиске новых идей, или начал развивать свою эротомеханику в каком то ином виде, AI не сможет предсказать такого, он может только создавать итерации его существующих работ, смешивая их с чем то новым. Однако, с другой стороны это не является большой проблемой, т.к. обыватель этот поверхностный подход как раз и ожидает получить, когда мы говорим «в стиле Гигера», все понимают о чем речь и ожидают плюс минус одно и тоже, никто не ожидает увидеть его работы в стиле кубизма.
Мысль 3: «Захватывающий визуал в кино и играх постепенно может перестать быть чем то важным, и это хорошо»
Это скорее попытка предсказать далекое будущее, поэтому эта идея может быть слишком far-fetched. И прийти в реальность эта идея может только если на свете появятся инструменты/приложения которые донесут всю мощь, даже текущих версий AI генераторов, до обычного пользователя и перенасытят его, что маловероятно. Грубо говоря когда женщины 50-70 лет будут скролить не Instagram (запрещённая в РФ экстремистская организация), а его аналог генерирующий на ходу еще более «развлекательный» контент с помощью AI. В таком случае обыватель будет перенасыщен визуалами, превосходящими то, что мы видим на данный момент в кино и играх, и это возможно заставит игры и фильмы сдвинутся ближе к их корням, делая упор на том что отличает их индустрию от других, и забыть о «Stunning Visuals!» как об особой selling point.
Безусловно, одно дело смотреть на картинку в статике, а другое - пролетать через уровень в игре, но я думаю корреляция тут все же будет значительной, если я смотрю на шикарный волшебный город в фильме Marvel и я видел десятки и сотни схожих по уровню мастерства работ в статике, буквально на этой неделе, «вау момент» будет не таким сильным.
Более того, на мой взгляд, уже на текущем «Е3» визуал не имел большого значения, даже без нейросетей. Особенно с UE5 и прочими инструментами, когда через 3-4 года нас догонит вся толпа разработчиков уже получивших доступ к движку, даже без фантазии AI генераторов, высокое качество картинки перестанет быть чем то уникальным.
Мысль 4: «Я не знал что мне делать с папкой на 100 референсов, что мне теперь делать с папкой на 10 000 референсов?»
Это наверное самая интересная вещь, которую я все еще пытаюсь для себя понять. Грубо говоря за месяц мне в голову приходят около десятка идей для сюжетов или игр в целом (не так много как раньше, из-за моей текущей занятости), из десятка этих идей будет одна две - самых интересных, которые очень четко выделяются на фоне остальных. Однако поскролив работы которые заказывают другие люди на MidJourney (или попробовав сгенерировать свои рандомные задумки), я пополню этот топовый tier список еще парой идей всего за 15 минут. Что лично у меня довольно быстро создало полный завал в голове, на месте пары интересных идей, за которые я готов был взяться, теперь десятки, и если продолжать исследовать и генерировать результаты, то и сотни идей такого же уровня. Конечно можно только порадоваться, но проблема которую я определил, в том что из них нельзя выделить что-то одно, что можно поднять еще выше в «наивысший tier», потому что его не существует, эти идеи уже на максимальном уровне «качества», поэтому выбрать из такого списка невероятно сложно, в отличии от прежнего процесса отделения зерен от плевел, где и то и другое было совершенно четко отделимо. Но возможно, со временем я пойму как с этим работать.
Это неполный список о чем я успел раскинуть мозгами, но остальные мысли пока не сформировались во что-то цельное, например как подобные решения могут превратить разработчика просто в «реализатора» картинок сделанных AI, и сбавить градус творческого вложения в разработку, и к чему это может привести т.к. я не думаю что разработчики будут рады подобной роли.