Нейросеть Stable Diffusion и женская красота в субботнюю ночь. И как сделать так же? Заходи, погляди, научись! Часть 1

В продолжение этого поста. Решил разобраться сам и нагенерировал девиц викторианской эпохи и королев в духе Средневековья, кое-где фентези чувствуется. ЧИСТО РАДИ ЭКСПЕРИМЕНТА И НАУЧНОГО ИНТЕРЕСА. Спойлер: возможности практически безграничные открываются. Гайд после картинок.

Продолжение подборки с дамами смотрите тут.

Как это делается?

Данный гайд для владельцев зеленых видимокарт. Других у меня нет, поэтому уж простите, господа!

  1. Открываем эту страницу https://rentry.co/8vaaa - тут автор изначальных картинок из предыдущего поста другого человека описал какие "положительную" подсказку (prompt) и "отрицательную" подсказку давал на вход Stable Diffusion, чтобы получить свои результаты, ну и опции дополнительные
  2. На том сайте есть ссылка на гайд по установке с советами (добрые люди в этом треде уже наверняка дали вам ссылку на него): https://rentry.org/voldy ВНИМАНИЕ! Не забудьте установить последнюю версию CUDA Toolkit
  3. Делаем все как сказано в разделе GUIDE. ВНИМАНИЕ! В пункте 3 нужно будет выбрать модель. Вам необходимо скачать модель (Alternate) 1.4 Waifu model она весит побольше, но и результаты, на мой взгляд, от нее лучше. Фактически это версия 1.2, сейчас уже доступна версия 1.3 beta ( на момент 01.10.2022), посмотреть какая сейчас актуальная версия модели Waifu Diffusion можно здесь
  4. Когда все сделано, запускаем (через webui-user.bat в корневой директории Stable Diffusion) в веб браузере веб интерфейс. Самый первый запуск будет не быстрым (10-15 минут), но потом все будет вполне себе быстро

Отлично. У вас все установлено: модель, необходимые библиотеки, голова и руки. Как начать генерировать картинки? Когда вы только открыли вы видите 2 поля ввода: Prompt и Negative Prompt. Первое это то, что ХОТИТЕ, чтобы нейросеть включала в картинку. Второе это то, что вы НЕ ХОТИТЕ, чтобы она включала в картинку. В Negative Prompt забейте инструкции, которые указаны на этом сайте (лично я "негативную" подсказку не менял вообще, с ней и работаю). В Prompt введите базовую "положительную" подсказку, указанную тоже на этом сайте, от которой потом будете отталкиваться, модифицируя ваши изображения и, собственно, добиваясь нужного вам результата.

Потом переходим на вкладку Settings, ищем Face Restoration и выбираем там CodeFormer. Возвращаемся на основное окно - txt2img. Обычно для большинства картинок я использую следующие настройки:

Resolution: 704 x 960 Sampling steps: 60 Sampling method: DDIM Restore faces: TRUE Highres. fix: TRUE CFG Scale: 12 Face Restoration: CodeFormer

Иногда использую вот такой пресет настроек для картинок разрешения побольше:

Sampling steps: 120 Sampling method: DDIM Restore faces: TRUE Highres. fix: TRUE CFG Scale: 15 Face Restoration: CodeFormer

Только помните, что данная модель была натренирована на картинках 512x512 разрешения.

А что каждая из этих опций означает?

  • Sampling method - алгоритм, используемый для генерации картинок. DDIM (его я и использовал), на мой взгляд, даёт более художественные результаты, выдержанные в неком едином стиле, а Euler a создает бОльший разброс по разнообразию, но стиль в целом общий может не соблюдать
  • Sampling Steps - чем больше, тем более детальнее прорабатывается картинка (это как я понял данную настройку), время генерации увеличивается чем выше тут значение
  • Restore Faces - для создания реалистичных лиц
  • HighRes Fix - нужно включать, если генерируете картинки разрешения больше 512x512 (замечено, что в случае увеличения разрешения рост времени, затраченного на генерацию, гораздо более сильный, чем при увеличении Sampling Steps)
  • CFG Scale - насколько СТРОГО нейросеть будет следовать вашей подсказке (меньшие значения дают более "креативные" результаты)
  • Что за вкладка img2img? - Ооо, это интереснейшая вещь. Позволяет НА ОСНОВЕ того, что вы сгенерировали, размножать результаты, создавая новые детали, вариации. Здесь можно использовать другой prompt, который может привнести в вашу картинку нечто новенькое. Чтобы переместить созданную картинку сюда нажмите на первой вкладке (txt2img) кнопку Send to img2img
  • Что означают круглые и квадратные скобки в prompt-ах? Круглые скобки (...) усиливают признак, который вы в них заключаете. Квадратные скобки [...] ослабляют признак. Чем в большее кол-во пар скобок вы берете признак, тем сильней он будет усиливаться/ослабевать внутри prompt-а и, соответственно, сильнее/слабее влиять на окончательный результат
  • Как убрать лишние головы/руки или ненужный элемент с картинки? Использовать фразу в положительном промпте со знаком "-" (минус). Ниже будут рассмотрены примеры (спасибо Blessfall за подсказку)
Нейросеть Stable Diffusion и женская красота в субботнюю ночь. И как сделать так же? Заходи, погляди, научись! Часть 1

Какие prompt-ы использовались в картинках выше?

Теперь о тех "положительных" prompt-ах, что я юзал:

#Prompt 1 (HER FULL LEGS), ((EROTIC)), (((FULL BODY PORTRAIT))), ((((VICTORIAN GIRL)))), ((((MEDIEVAL QUEEN)))), (FULL FACE), (((BIG LIPS))), (((LARGE BREAST))), ((WIDE HIPS)),((THICK THIGHS)), HIGH DETAIL, ((YOUNG LADY)), ((WAVY BLONDE HAIR)), FEMININE,((PERFECT FACE)),((SEXY FACE)),((DETAILED PUPILS)), ((OIL PAINTING)), (ARTIST),((TONED ABS)),SEXY POSE, SMIRK,LOOK AT VIEWER, ((BLOUSE)),(INTRICATE),SHARP #Prompt 2 (HER FULL LEGS), ((EROTIC)), (((FULL BODY PORTRAIT))), ((((VICTORIAN GIRL)))), ((((ROMAN EMPRESS)))), (FULL FACE), (((BIG LIPS))), (((LARGE BREAST))), ((WIDE HIPS)),((THICK THIGHS)), HIGH DETAIL, ((YOUNG LADY)), ((WAVY HAIR)), FEMININE,((PERFECT FACE)),((SEXY FACE)),((DETAILED PUPILS)), ((OIL PAINTING)), (ARTIST),((TONED ABS)),SEXY POSE, SMIRK,LOOK AT VIEWER, ((BLOUSE)),(INTRICATE),SHARP #Prompt 3 (((TWO FULL LEGS))), ((EROTIC)), (((FULL BODY PORTRAIT))), ((((VICTORIAN GIRL)))), ((((NOBLE BLONDE)))), (FULL FACE), (((BIG LIPS))), (((LARGE BREAST))), ((WIDE HIPS)),((THICK THIGHS)), HIGH DETAIL, ((YOUNG LADY)), ((WAVY HAIR)), FEMININE,((PERFECT FACE)),((SEXY FACE)),((DETAILED PUPILS)), ((OIL PAINTING)), (ARTIST),((TONED ABS)),SEXY POSE, SMIRK,LOOK AT VIEWER, ((BLOUSE)),(INTRICATE),SHARP #Prompt 4 (((SHOW LEGS))), ((EROTIC)), (((FULL BODY PORTRAIT))), ((((VICTORIAN GIRL)))), ((((NOBLE BLONDE)))), (FULL FACE), (((BIG LIPS))), (((LARGE BREAST))), ((WIDE HIPS)),((THICK THIGHS)), HIGH DETAIL, ((YOUNG LADY)), ((WAVY HAIR)), FEMININE,((PERFECT FACE)),((SEXY FACE)),((DETAILED PUPILS)), ((OIL PAINTING)), (ARTIST),((TONED ABS)),SEXY POSE, SMIRK,LOOK AT VIEWER, ((BLOUSE)),(INTRICATE),SHARP

Можете добавлять рандомных художников, чтобы программа использовала их стиль. Смешение художников дает интересные результаты. Делается это с помощью иконки палитры справа от окошка ввода "положительной" подсказки.

Что делать, если у вас генерируются черные или зеленые картинки?

Снимать штаны и бегать. На самом деле скорее всего у вас что-то из GTX 1060, GTX 1660 Super, GTX 1070. У этих моделей отсутствует поддержка half precision floating point numbers , и это вызывает такие ошибки. Обойти можно так:

  1. Открываем на изменение любым текстовым редактором файл, через который вы Stable Diffusion запускаете - webui-user.bat
  2. В нем есть строка set COMMANDLINE_ARGS=
  3. Поменяйте её на set COMMANDLINE_ARGS=--precision full --no-half
  4. Сохраняем изменения и закрываем файл, перезагружаем программу и теперь всё должно нормально генерироваться

Как обновить модель Waifu Diffusion на более новую?

  1. Скачиваем по ссылке отсюда последнюю версию модели (на момент 05.10.2022 доступна бета версии 1.3, которую ВСЁ ЕЩЕ ОБУЧАЮТ)
  2. Если верить вот этим словам просто заменить файл модели на более новую версию, спасибо Kristaller
  3. Запускаем как и раньше

Замечу, что для картинок, которые генерировал, я не использовал других художников. Совсем. Много полезных ссылок (в том числе специфические поисковики по Stable Diffusion) можно найти на сайте с гайдом по установке.

Но если вам лень туда идти, то вот: для поиска картинок, созданных Stable Diffusion, по степени сходства стиля и какие промпты были для них использованы можно использовать, к примеру, эти сайты:

Вот еще статьи от других авторов промптов, советую посмотреть их:

2020 показов
59K59K открытий
44 репоста
104 комментария

Комментарий недоступен

Ответить

Это сиськореанская эпоха!

Ответить

Зато попала в... другие интересные аспекты!

Ответить

Нейросети пока что всего лишь грубоватые инструменты. На чём тренировали и что у неё запросили - то и нарисовала. Спойлер: в данном случае аутентичные девы викторианской эпохи целью не были изначально.

Ответить

Ну нейросетка не историк, плюс сами изображения она делает отлично, пока большего и не требуется

Ответить

\\\Открытые животы и сиськи не про викторианскую эпоху, это 2020\\\

Сходите в эрмитаж, или в какой старый музей.
Бальные платья 17-18 века на картинах такие, что сиськи видно почти полностью, больше чем тут)
Соски почти торчат и ореолы видно.
Но да, кроме сисек и шеи - все остальное наглухо закрыто

Ответить

В такие времена живем что сам факт того что нейросетка знает что такое сиськи, это уже счастье. На днях в миджорни канале снова видел посты какой-то истерички что генерировать красивых женщин не по феншую их тамошних стандартов сои

Ответить