Лучше Midjourney? Сравниваем SDXL 0.9 и Midjourney⁠⁠

Компания Stability AI представила обновлённую версию нейросети для генерации изображений по текстовому описанию Stable Diffusion — она получила название SDXL 0.9.

По сравнению с предшествующей новая версия обещает создание более качественных и детализированных фотореалистичных картинок.

«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.
«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.

Разработчик охарактеризовал новую модель искусственного интеллекта как «прорыв в творческих вариантах применения генеративного ИИ изображений».

«Волк в Национальном парке Йосемити, документальная съёмка природы»
«Волк в Национальном парке Йосемити, документальная съёмка природы»

В этой статье я постараюсь разобраться, так ли хороша эта нейросеть, а также сравню её в некоторых аспектах с Midjourney, которая пока считается лучшей.

«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»
«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»

Доступность и цена

У Midjourney есть некоторые ограничения, связанные с популярностью платформы.

Чтобы сохранять работоспособность серверов, разработчики предоставляют бесплатный доступ, ограниченный 25 операциями или попытками. В этот лимит включаются любые команды, которые требуют использования нейронных сетей, включая повторную генерацию той же картинки с другим результатом и функцию увеличения изображения.

Если вы используете сервис Midjourney, то имейте в виду, что каждое действие, которое вы выполняете, расходует одну из ваших попыток. Например, нажатие кнопок V, U и круг также будет уменьшать количество ваших попыток.

Если вы хотите воспользоваться платными возможностями Midjourney, то цены на подписку следующие: базовый план (200 GPU-минут в месяц) стоит 10 долларов в месяц (~600 рублей), стандартный план (15 GPU-часов в месяц) стоит 30 долларов в месяц (~1800 рублей), а корпоративный план (120 GPU-часов в год) стоит 600 долларов в год (~35 600 рублей).

"GPU-минуты/часы" - это количество действий, которые можно выполнить в рамках выбранного тарифа. Например, лимит в 200 GPU-минут в месяц на базовом плане подписки означает, что вы можете сгенерировать до 200 изображений в месяц. Если вам нужны дополнительные попытки, вы можете их докупить за 4 доллара (~240 рублей) за один GPU-час, что составляет примерно 60 команд генерации или масштабирования изображения.

Стандартный план за 30 долларов в месяц предоставляет пользователю 15 GPU-часов (900 GPU-минут) в месяц - это очень много возможностей для создания изображений.

Что насчёт SDXL 0.9? Доступ к модели можно получить через ClipDrop уже сегодня. Пока идёт бета-тест и все работает бесплатно. Но к концу бета-теста, когда разработчики исправят все баги и неточности, доступ скорее всего станет платным. Но пока не будем гадать наперед.

Качество генерируемых картинок

Я ввел запрос man (ссылку на нейросеть оставлю в конце статьи) и вот какие 4 варианта мне выдала SDXL 0.9.

По моему личному мнению, качество изображения ничуть не уступает Midjourney, а иногда даже качественнее.

Midjourney 5.2
Midjourney 5.2
SDXL 0.9
SDXL 0.9

Посмотрите на два изображения птицы выше. На генерации ниже — результат работы SDXL 0.9. Выше — новая версия Midjourney 5.2.

Создание изображения происходило на базе одного и того же промта:

an painting by the artist of the dream world, in the style of hybrid creature compositions, intricate psychedelic landscapes, hyper-realistic bird studies, colorful moebius, weirdcore, pink and cyan, cybermysticpunk

С ходу в глаза бросается объемность, тени и детализация от SDXL 0.9. Пока что Stable Diffusion выглядят поувереннее.

И да: нейросеть Stable Diffusion научили генерировать нормальные человеческие пальцы. Во всех сервисах для генерации изображений с этим были большие проблемы.

SDXL 0.9 предлагает огромное количество разных стилей: фотореалистичный, аниме стиль, диджитал-арты, иллюстрация и многое другое. Сравнение стилей между собой можете посмотреть ниже

Удобство

Не скажу, что Midjourney неудобен, но чтобы начать им пользоваться, нужно сделать определенные манипуляции. Со SDXL 0.9 все намного проще: зашёл на сайт, пишешь свой запрос и получаешь результат.

Итог

SDXL 0.9 не уступает Midjourney ни по каким показателям, изображения генерирует очень даже хорошо. А ведь нейросеть находится на этапе бета-теста, поэтому у нее есть все шансы стать ещё лучше.

Напомню, что выход SDXL 1.0 с открытым исходным кодом намечен на середину июля.

Канал с качественными промтами:

Попробовать Midjourney бесплатно:

88
5 комментариев

С каких это пор в Midjourney вернули бесплатные попытки?

1
Ответить

нейросети не нужны уву

Ответить

А ещё SDXL поддерживает Лоры. Так что миджорней может отдыхать.

Ответить

Sd рулит.

Ответить

Не совсем понятно, почему не пишут, что тариф Midjourney за 30 долларов дает безлимитку на месяц, если fast генерации закончатся, можно пользоваться relax генерациями, тоже самое, только в очереди чуть подольше подождать, но все равно очень быстро и как правило более чем достаточно.

Ответить