Я сравнил новую модель Photon_v1 с Reliberate и сильно удивился результатам

Я сравнил новую модель Photon_v1 с Reliberate и сильно удивился результатам

Хачатур со своими Reliberate и Deliberate продолжает хайповать, однако выходят и другие модельки, которые понимают запрос лучше и имеют более высокое качество. Я решил проверить одну из новых моделей под названием Photon_v1 и был приятно удивлен.

Она не только лучше понимает промпт и стили, но и более стабильна на высоких весах токенов. К примеру. я хочу генерацию в стиле tilt-shift. Сейчас сравним результаты Photon_v1, Reliberate и Deliberate.

Посмотрите на качество реализма у Photon_v1, на пропорции, детали. Генерация получилась всего раза с третьего.

У Reliberate_v20 преимущества по сравнению с младшей версией минимальны, а следование запросу отвратительное. Часто я получаю много объектов в кадре и искаженные пропорции, а также текстуры мыльного качества и песок.

Deliberate_v2 показала себя хуже всех из тройки, ибо часто выдавала генерации, созданные по последним частям промпта, а не первым, как это нужно делать.

(tilt-shift shot:1.5), генерация с применением hi-res fix
(tilt-shift shot:1.5), генерация с применением hi-res fix

Посудите сами: я хочу получить генерации в QHD, например, а для этого понадобится апскейл, желательно с помощью hi-res fix. Это непростая и очень долгая операция, отнимающая силы и время. Нахрена мне возиться с делибой или релибой, когда я могу взять и практически с первого раза получить то, что мне нужно, да еще и не отключая hi-res fix?

Раньше я был категорически против него, ибо уходит много времени. Однако сейчас я просто скачал нормальную модель :3

(high angle:1.2), генерация с применением hi-res fix
(high angle:1.2), генерация с применением hi-res fix

При тестировании я вставлял в промпт один из стилей, генерил на нем изображение, после чего фиксировал seed и двигался к следующей модели. Если получалась совсем хрень, то приходилось проделывать эту операцию заново.

Важно уточнить, что я пользуюсь расширением CFG Scale dynamic trashholding, скачать которое вы можете по ссылке. Также я показывал на примерах, как именно оно мне помогает, а также написал статью о том, как работает CFG Scale.

Вот настройки, на которых я тестировал все модели:

high-speed white yacht sailing on the sea, waves, stunning seascape, blue water

Negative prompt: cartoon, painting, illustration, (worst quality, low quality, normal quality:1.8), (grayscale:1.3)

Steps: 22, Sampler: DPM++ 2M Karras, CFG scale: 9, Seed: 3655809322, Size: 1200x512, Model: photon_v1, Denoising strength: 0.4, Clip skip: 2, Hires upscale: 2, Hires steps: 10, Hires upscaler: 4x_NMKD-Superscale-SP_178000_G, Dynamic thresholding enabled: True, Mimic scale: 7, Threshold percentile: 100, Version: v1.5.0

(Steampunk:1.6), генерация с применением hi-res fix
(Steampunk:1.6), генерация с применением hi-res fix

Генерации на Photon_v1 получаются живыми, насыщенными, наполненными деталями, которые к тому же хорошо прорисованы. Генерации действительно похожи на снимок — в отличае от Reliberate.

Посмотреть подробное сравнение вы можете по ссылке на документ Figma.

Стили для ваших генераций

Vintage: Добавьте в образ ностальгические, классические предметы и ретро-нотки

High Angle: Снимайте объекты сверху, чтобы подчеркнуть их окружение.

Bird's-Eye View: Фотографируйте объекты так, как будто вы смотрите вниз с высоты птичьего полета.

Fisheye View: Захватите искаженную широкоугольную сцену, похожую на отражение в аквариуме.

Minimalist Perspective: Сочетайте простоту с основными элементами и незагроможденным пространством.

Selective Focus: Выделите объект, сохраняя его четкость и размывая окружение.

Panning Blur: Синхронизируйте движение камеры с движением объекта съемки, чтобы сохранить его четкость.

Bokeh: Создавайте мягкие, мечтательные фоновые эффекты с размытыми областями, используя неглубокий фокус.

Tilt-Shift Blur: Имитируйте миниатюризацию с помощью небольшой глубины резкости.

Majestic: Запечатлевайте впечатляющие сцены, вызывающие удивление.

Breathtaking: Запечатлевайте сцены сильного благоговения или опасности, вызывающие сильные эмоции.

Vibrant: Придайте фотографиям живые, насыщенные цвета для придания энергичного вида.

Surrealistic: Создавайте нереальные и мечтательные образы с неожиданными поворотами.

Eerie: Создайте тревожную атмосферу, используя необычное освещение и приглушенные цвета, напоминающие о сверхъестественном.

Long Exposure: Увеличьте время выдержки для световых дорожек, фиксируя течение времени.

Chiaroscuro: Создавайте эффектные фотографии с сильным контрастом между светом и тьмой.

Contrast Filters: Отрегулируйте различия в цвете и тоне для усиления контрастности.

Silhouette: Контрастный объект на ярком фоне, создающий эффектные темные очертания.

Backlit: Подсветка сзади создает эффект ореола, добавляя драматизма и атмосферы.

От себя рекомендую смело повышать веса на токенах стиля, чтобы получить необычный и выраженный эффект.

Congratulations, мы закончили!

Буду рад обратной связи и вашим комментариям, а также приглашаю в свой телеграм чат, где отвечу на все вопросы касаемо SD.

Буду рад видеть вас в телеграм-канале, где я собираю лучшие гайды по Stable Diffusion. А если не найду, то пишу сам.

Ссылка на модель Photon_v1.

2525
11 комментариев

А где тут реализм? На первой картинке кусты белого цвета(у соперников они хотя бы зеленые). Волны выглядят нереалистично. Такое впечатление как будто смотришь на игрушечный корабль.

На второй картинке корабль почему-то сплющило по продольной оси и кильватерная струя спереди корабля зачем-то.

На картинке с парусником нет форштевня, передние два паруса крепятся непонятно к чему, те же проблемы с пенящейся водой перед кораблем, позади вроде бы должна быть кильватерная струя, а там что-то похожее на пенящиеся барашки волн

3
Ответить

Ля ну ты и тип))))

2
Ответить

это все хорошо только при беглом взгляде, чуть задержишься и пиздец, нелогичная ассиметрия, дикие косяки в деталях, которые заебешься исправлять

1
Ответить

Да, есть технические нюансы, которые, конечно, надо знать. Их возможно дорабатывать уже на пост-продакшене, либо более точечно промпт писать. И как раз-таки с фотоном будет проще промпт подогнать, ибо модель его лучше понимает

Ответить

О походу первый автор на дтф по нейросетям, который делает уважительно)

1
Ответить

Мало мне ежедневно по работе в фигме сидеть - теперь туда и с дтф посылают :'(

1
Ответить

Очень годно. Спасибо!

1
Ответить