Как я нейросети пробовал

Целый год из каждого утюга я слышу про нейросети - они порабощают человечество. Художники один за другим остаются без работы, потому что теперь классный арт может генерировать любой желающий в один клик. Прикольно. Посмотрим, так ли это на самом деле (спойлер: нет)

Как я нейросети пробовал

Занимаюсь разработкой видеоигр. Все свои проекты я делаю соло. Код, графику, музыку, звуки, тексты, геймдизайн, и даже пытаюсь в маркетинг. Работы МНОГО. Интересно хотя бы часть её сбагрить нейросети. Желательно самое трудоёмкое - катсцены и промо арт.

Какие есть варианты чтобы попробовать и бесплатно?

  • Офф сайт Stable Diffusion и их простенький промт
  • Развернуть нейросеть Stable Diffusion у себя на компе
  • Использовать онлайн-сервис, но они все, сцука платные с подачками на дейли-гифтах

Я развернул у себя Easy Diffusion по рекомендациям Христа - того самого, который более менее рабочие репаки продукции адоба на торренты заливает. У меня руки из жопы в установке и настройке софта, поэтому контрольно я генерил на офф сайте Stable Diffusion и в онлайн сервисе Night Cafe. Оно платное, но есть дейли гифты на пять кредитов - хватит на пару мелких генераций. Если скопить - можно и посерьёзнее штуки сгенерить.

Миджорни не стал пробовать - слишком много гемора с ней. С чатгпт то же самое.

Смотрите какая задача: мне нужно для игры арт в главное меню сделать. Девушка - полу-робот в кибер-стиле, с кучей проводов и в виртуальном шлеме.

Промт:

cyber girl front with virtual helmet and wires

Google и Pinterest меня прям отлично понимает в этом вопросе. Я хочу что-то вот такое, да:

Но это кто-то нарисовал. А я хочу своё. Поэтому я с хитрой лыбой жму кнопочку Generate в Stable Diffusion и жду обещанного чуда.

Stable diffusion меня не понимает. Генерации выглядят так:

Повторение промта и изменение стиля выдаёт примерно то же самое, как вы видите. Изменение промта не сильно улучшает результат, увы.

Пробовал в Easy Diffusion, мдэ:

Оно меня совсем не понимает.

Пробовал в онлайн-сервисе Night Cafe. Мне дали 10 про генераций с SDXL 1.0. Потратил часть, чтобы показать вам:

Выглядит сочно, конечно... Но опять - не то что я бы хотел!

А без этих прошных манипуляций, за бесплатные кредиты, получается что-то такое:

Как я нейросети пробовал

Идею вы уловили. Пока составлял промты и ждал все эти генерации - за это время я бы уже давно рефов с пинтереста надёргал и наполовину нарисовал свой собственный арт.

Решил упростить задачу нейронке. Генерировать обложки для своих музыкальных треков. Мне нужно не что-то конкретное, а допускается полёт фантазии. Хотя бы что-то НА ТЕМУ.

robotic jungles

Хочу джунгли с робо-деревьями. Смотрим:

Easy Diffusion с моего компа. Похоже? Нет.
Easy Diffusion с моего компа. Похоже? Нет.
Палехче, Stable Diffusion. Я хотел не робота в джунглях, а робо-джунгли. Хотя вот в нижнем ряду варианты симпотные, но не роботик ни разу
Палехче, Stable Diffusion. Я хотел не робота в джунглях, а робо-джунгли. Хотя вот в нижнем ряду варианты симпотные, но не роботик ни разу
Что именно тут robotic, хотел бы я знать. Мимо.
Что именно тут robotic, хотел бы я знать. Мимо.

А вот такие референсы я за пол-нано-секунды нашёл в pinterest по тому же запросу:

Я не могу взять и использовать эти картинки для своих нужд, но могу по их мотивам что-то сам нарисовать. А не долбить кнопку генерации 2 Зулин-часа подряд, чтобы найти приемлемый вариант.

Industrial very high electric tower touches clouds

Есть у меня такая локация в игре, где нужно высоко подниматься внутри электробашни. И трек к этой локации есть. Для него мне обложка нужна была.

Как выглядит сама локация, для праздного интереса:

Как я нейросети пробовал

Смотрим, что мне предлагают нейросети:

Моя настольная Easy Diffusion как всегда в пролёте фантазии.
Моя настольная Easy Diffusion как всегда в пролёте фантазии.
Stable Diffusion, а это ведь неплохо. Пробовал разные стили.
Stable Diffusion, а это ведь неплохо. Пробовал разные стили.

На левой верхней нравится башня, но вот рядом стоящие мини-башни - кто погнул им круги? Вторая тоже нечего так. Нижняя левая прям интересно, но простовато и на электробашню не похоже. Последняя слишком мульташная, но что-то в этом есть.

У Night Cafe с XDSL красиво получается, но это не та башня, которую я хотел увидеть.
У Night Cafe с XDSL красиво получается, но это не та башня, которую я хотел увидеть.

На pinterest по тому же промту ищется чуть дольше нано-секунды:

Power Generator

Хочу что-то мощное. Под метал-электронный трек, который я тут когда-то выкладывал. Чтобы вот ты глянул на картинку и сразу МОЩЬ почувствовал! Чтобы кровь в жилах затанцевала!

Смотрим:

Easy Diffusion. Как бы да. Но как бы и нет.
Easy Diffusion. Как бы да. Но как бы и нет.
Stable Diffusion. Справа сверху вроде бы мощщщщный, но скорее стат-погрешность, судя по остальным генерациям из этой серии. Дом? Женщина? Киборг? Камон.
Stable Diffusion. Справа сверху вроде бы мощщщщный, но скорее стат-погрешность, судя по остальным генерациям из этой серии. Дом? Женщина? Киборг? Камон.
Похоже да. Монументально. Но мощщщщщи не хватает. Не годится.
Похоже да. Монументально. Но мощщщщщи не хватает. Не годится.

В пинтересте можно залипнуть и не отлипнуть:

Злоключение

Вы видите, что я пытался решить нейросетями свои производственные задачи. Не смог.

Генерация в один клик, говорили они. Да, но:

  • 99% генераций - говно, или не соответствует запросу
  • Каждая генерация занимает от 15 до 180 секунд в зависимости от видюхи/сервиса/разрешения/нагрузки

Самое интересное, что в разговорах о нейросетях никто об этом не рассказывает XD

ТЕОРЕТИЧЕСКИ, вы сможете сгенерировать нужный вам арт. Но вы потратите так много времени на подбор промта и отбор картинок, что... Не уверен, что с такой скоростью и качеством Вася с улицы заменит профи Джона - того самого художника, которого уволили, чтобы взять более дешёвого Васю =)

Допускаю, что я лох и не умею составлять промт. Значит этому нужно учиться, чтобы составлять запросы для нейросети эффективно. Снова речь не про Васю с улицы, а про чела с опытом.

В качестве помощника для художников выглядит пока что тоже сомнительно. Работает медленно и неточно. Именно нужную генерацию скорее всего вы будете искать мучительно долго. Для продакшена не годится.

А если вам нужно что-то эдакое, новое придумать и нарисовать... в фантастическом сеттинге. Удачи.

Как я нейросети пробовал

P.S. Разве как баловство. Чтобы получить одну хоть какую-нибудь крутую генерацию из тысяч говна, и побежать орать в интернетах что профессии художника настал конец =)

4
31 комментарий