{"id":3969,"url":"\/distributions\/3969\/click?bit=1&hash=48c68cd06f36b39a25459ccf1eb45b64c2d731fecbb5a11dd3f0aa328b271ec3","title":"\u041c\u0435\u0447\u0442\u0430\u043b\u0438 \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u0441\u0435\u0431\u044f \u0432 UX-\u0434\u0438\u0437\u0430\u0439\u043d\u0435? \u0412\u043e\u0442 \u0432\u0430\u0448 \u0448\u0430\u043d\u0441","buttonText":"\u041f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c","imageUuid":"ec569b6e-3358-530c-a9e2-771b323df475","isPaidAndBannersEnabled":false}

Вышла Stable Diffusion 2.0

Open-source генеративная нейросеть получила крупный апгрейд

Гифка c результатами обновленного метода inpainting

Всего месяц прошел с предыдущего релиза нейросети версии 1.5, а Stability-AI уже выложила новую версию базовой модели Stable diffusion (а точнее - 4 с половиной версии), улучшающую общее качество создаваемых изображений и дающую дополнительные возможности для генерации:

  • Отдельная модель, обученная на изображениях с разрешением 768*768. У изображений такого разрешения больше не должна ломаться композиция. Больше исходное разрешение - меньше проблем повысить разрешение до 4к и выше. Ссылка на модель - https://huggingface.co/stabilityai/stable-diffusion-2/blob/main/768-v-ema.ckpt
  • Модель с отдельным слоем распознавания глубины на изображениях. Позволяет лучше переносить сохранять глубину в методах img2img и inpainting, будет полезно при генерации вариаций скетчей и фотографий - Ссылка на модель - https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt
Пример сохранение глубины с наброска в img2img

Для запуска новых моделей в текущих программных сборках Stable Diffusion вроде Automatic1111, NMKD, InvokeAi создателям необходимо внести небольшие правки в код, поэтому ждем обновленных версий ПО сборок в ближайшее время.

С генерацией NSFW в этих новых моделях будет не очень хорошо, т.к создатели утверждают, что в их новом отобранном датасете для обучения таких изображений не было.

Для желающих почитать сайт с оригинальной новостью:

Содержание скрыто
Показать
0
73 комментария
Написать комментарий...
Грайр
С генерацией NSFW в этих новых моделях будет не очень хорошо

Ну и зачем оно надо тогда?

Ответить
Развернуть ветку
Гибкий корабль

Новые модели, которые научат на NSWF изображениях поверх базовой 2.0, будут лучше. Но вообще гадство, да.

Ответить
Развернуть ветку
Fiop Kisten

Это нам надо.

Ответить
Развернуть ветку
Асилбек

Что там с пальцами?

Ответить
Развернуть ветку
Гибкий корабль

Апдейт - текстура у рук стала получше, но с количеством пальцев все еще не очень хорошо https://www.reddit.com/r/StableDiffusion/comments/z3a4ye/prompt_woman_showing_her_hands_on_stable/.

Ответить
Развернуть ветку
1 комментарий
Гибкий корабль

Пока хз. Но для части новых моделей они и так уже хорошо рисовались. Для других есть уже гениальная по простоте идея - негативные текстовый эмбеддинг bad_promt, которая выправляет много косяков с анатомией https://www.reddit.com/r/StableDiffusion/comments/yy2i5a/i_created_a_negative_embedding_textual_inversion/

Ответить
Развернуть ветку
Влад Демин

С правильным Promt и каплей везения, они и в 1.4 норм были

Ответить
Развернуть ветку
Александр Головин

Там же ещё стили выпилили. Никаких больше волшебных art by Greg Rutkowski. Тобишь вся стилизация сгенереных артов идёт дружно в одно место.

Ответить
Развернуть ветку
Гибкий корабль

Да, выпилили современных художников и большую часть фоток известных людей из датасета. В целом качество генерации всего, кроме котиков, мне на сравнениях у новой базовой модели не понравилось, даже не стилизованные изображения, в целом, хуже. Не хватает референсов, похоже.

Создатели оправдываются, что теперь к ним с легальной точки зрения не подкопаешься и учить что-то поверх этих моделей будет якобы проще. Дескать нужно вам NSFW и Грег - сами учите и разбирайтесь с этическими/легальными вопросами, а официально мы будем развивать только *безопасную со всех сторон* модель.

Меня в любом случае радует идея модели с искусственной глубиной

Ответить
Развернуть ветку
10 комментариев
Михаил Турок

Хейтай сайты уже полностью засраны картинками от нейронок

Ответить
Развернуть ветку
Владимир Семёнов

Не видел такого. Это где? Как найти? Интересно заценить, что эта штука может в хентае. 🤔

Ответить
Развернуть ветку
Назарий Вениаминов

Как я понял, теперь надо ждать сборки от энтузиастов. А это будет базовая модель для абстрактных форм.

Ответить
Развернуть ветку
Илья Ульянов

Чёрт, астанавитись!!! Я не успеваю!!!)))

Так... сразу ряд вопросов:
Автоматика1111 и так вроде сносно генерит 768 (я только их и делаю, особых проблем не наблюдаю). А чем это принципиально лучше?
И теперь что, надо переключаться между моделями, чтобы генерить 512 и 768? А та что 768 с 512 не очень будет справляться?

Ответить
Развернуть ветку
Илья Ульянов

Вот, 768х512. Сд 1.5 (да и в 1.4. норм было)

Ответить
Развернуть ветку
7 комментариев
Виктор Злобин

Да, на модели 768 нужно будет выставлять минимум 768х768 чтобы был нормальный результат.

Ответить
Развернуть ветку
Ilya Medvedev

Тонна была проблем с пропорциями не в квадрат когда есть люди. Оно из людей начинает миксовать массы будто на игральных картах все пополам.

Ответить
Развернуть ветку
Iam Niam

Где можно скачать рабочую версию 1.5, чтоб вот скачал и запустил? Без докачиваний, настраиваний лишних.

Ответить
Развернуть ветку
Антон Батон
Ответить
Развернуть ветку
5 комментариев
Blessfall

Можешь онлайн попробовать. тут один добрый человек делится ресурсами - можешь попробовать https://lukium.ai/ там 3 фри инстанса (2.0, inpaint, outPainting) или

Ответить
Развернуть ветку
2 комментария
DENISKO

А почему в NMKD нету генерации только участка изображения как тут на видео? Очень удобно. https://www.youtube.com/watch?v=uMf0pO9VFAk&lc=UgySuL8ZOtrkiGVBeaJ4AaABAg.9iIJ1W28bAp9iJmM6Oan1Q

Ответить
Развернуть ветку
Влад Демин

Есть, там оно Masking называется

UPD: а вообще, видео выглядит как связка фотошопа и webui

Ответить
Развернуть ветку
2 комментария
Alex

Попробуем. Хорошие новости.

Ответить
Развернуть ветку
Ценный пришелец

Подожду апдейт DiffusionBee, руками лень настраивать :)

Ответить
Развернуть ветку
Blessfall

Не так давно набрёл на одно комьюнити, где один добрый человек делится ресурсами - можешь попробовать https://lukium.ai/ там 3 фри инстанса (2.0, inpaint, outPainting)

Ответить
Развернуть ветку
2 комментария
Трилобит Федя

Ля, новый кринж подвезли, опять вся лента в нейровысерах будет неделю?

Ответить
Развернуть ветку
Гибкий корабль

Не, тут принципиально новой кринжатины, как с Remix, не будет. Просто старый вид кринжа будет более качественным)

Ответить
Развернуть ветку
Sunstr1der

блин, когда это счастье под видюхи амд уже сделают? :/

Ответить
Развернуть ветку
Гибкий корабль

Оно запускается на амд, под виндоус - с мозгоебством. Я пробовал дистанционно помочь его установить на амд (https://github.com/azuritecoin/OnnxDiffusersUI/), потерпел фиаско. Из под линкуса, говорят, нормально идет и достаточно быстро генерирует

Ответить
Развернуть ветку
4 комментария
Semyon Goloviznin

Объясните, плез, тем кто вообще не шарит, как я могу попробовать эту нейроночку?

Ответить
Развернуть ветку
Илья Ульянов

Сначала изучаешь все гайды автора, вдумчиво и внимательно. Потом уже вопросов быть не должно)

Ответить
Развернуть ветку
Илья Ульянов

Чё-то как-то криво генерит 2.0 768.
Вот эти вот квадратики постоянно наблюдаю.

Huge anthropomorphic humanoid monster Cthulhu grabbed a car on the freeway in the rain in the night fog, photorealistic, realistic lighting, hyperrealism, realism, ultra definition, ultra realistic details, high definition, cinematic lighting, cinematic atmosphere, beautiful dramatic dark moody tones and lighting, studio lighting, global illumination, shadows, octane render, 8 k
Negative prompt: blur, blurry, cropped, lowres, worst quality, low quality, normal quality, jpeg artifacts, text, watermark, username, signature
Steps: 60, Sampler: Euler a, CFG scale: 25, Seed: 902219953, Size: 1024x768, Model hash: 2c02b20a, Model: SD_v2_768-v-ema

Ответить
Развернуть ветку
Гибкий корабль

Мои подозрения - Виноваты highres.fix, в котором надо denoising выставить побольше, нестандартное разрешение и samlper. Там прям видно, как после увеличения разрешения с 768*768 до 1024*768 туча квадратов появляется и дальше каждые 5 шагов их все меньше и меньше, но совсем они не уходят. А на 1024*1024 - почти полностью исчезают. А еще ты с длинной запроса переборщил :) Глянь почти тоже самое - Huge anthropomorphic humanoid monster Cthulhu grabbed a car on the freeway in the rain in the night fog, photorealistic, realistic lighting, hyperrealism, realism, ultra definition, ultra realistic details, high definition, cinematic atmosphere, beautiful dramatic dark moody tones and lighting, studio lighting,, shadows
Negative prompt: blur, blurry, cropped, lowres, worst quality, low quality, normal quality, jpeg artifacts, text, watermark, username, signature
Steps: 80, Sampler: DPM++ 2M Karras, CFG scale: 25, Seed: 902219953, Size: 1024x1024, Model hash: 2c02b20a, Model: 768-v-ema, Denoising strength: 0.8, First pass size: 768x768

Ответить
Развернуть ветку
3 комментария
Илья Ульянов

Хах, только написал, и нормальные картинки пошли))) Хотя ДО того раз 5 подряд выдавало вот подобное непотребство, которое показал выше.

а вот сид 4254860023
интересно обыграл "антропоморфный человекоподобный" ... Напомнило историю с Фаллаут 3, с поездом на ножках.

Ответить
Развернуть ветку
Илья Ульянов

Вот опять... (на потолок смотрите). В общем раз через раз всё выглядит как растянутый jpeg . При 1.5 и ниже такой херни не было)

это img2img , поэтому без параметров...

Ответить
Развернуть ветку
1 комментарий
Владимир Семёнов

Прогресс это отлично. С NSFW не беда. Модель всегда можно дообучить. Вот и пришло время для дообученных нейросеток чисто для NSFW! Ждём с нетерпением!

P.S.: уже есть хорошие дообученные модели. На пример для вайфу несколько есть. Есть нейронка от ChromedSets, которая генерирует секси пышногрудых дам. Так что NSFW вообще не проблема. 🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳🥳

Ответить
Развернуть ветку
Владимир Семёнов

Видеокарты не для нейронок. Потому и дорого. Ждём спец карточек чисто для нейронов. Чем больше нейронки развиваются, тем больше смысла в таких карточках. Потому постепенно люди будут их чаще покупать. Особенно специалисты для работы с нейронками. Так что с дообучением и мощностями проблем быть не должно. Ждём.

Ответить
Развернуть ветку
Читать все 73 комментария
null