AI-переодевание: тест-драйв главных нейросетей

Развитие генеративных нейросетей за последние годы стало ключевым фактором, влияющим на рабочие процессы в креативных индустриях. В мире моды особое внимание приковано к технологии смены одежды на моделях — функции, которая потенциально способна оптимизировать затраты и ускорить выход коллекций на рынок.

AI-переодевание: тест-драйв главных нейросетей

Но как ретушер, который каждый день работает с реальной одеждой, я смотрю на это с долей здорового скепсиса. Я знаю, как важна текстура ткани, как ведет себя принт на складках и насколько реалистично ложатся тени. Именно эти детали отличают качественную коммерческую фотографию от дешевого фотомонтажа.

Так что же на самом деле умеют нейросети сегодня? Я решила устроить большую проверку и посмотреть, справятся ли популярные AI-инструменты с этой задачей.

Для эксперимента я выбрала четыре совершенно разных по своей сути инструмента:

  1. Adobe Firefly v3
  2. Flux.ai
  3. ChatGPT
  4. Pic-Pilot

Для чистоты эксперимента я сгенерировала базовое изображение модели в стиле каталожной съемки и поставила перед нейросетями две задачи:

  • Простая задача: "надеть" базовую белую футболку.
  • Сложная задача: "надеть" бордовый бомбер (более сложный крой и цвет).

Важный нюанс: Нужно учесть, что для этого теста я использовала полностью сгенерированные изображения — и саму модель, и одежду-референс. Это идеальные, "стерильные" условия для нейросетей. Можно предположить, что при работе с реальными фотографиями, где есть сложное освещение, естественные дефекты ткани и неидеальные ракурсы, результаты были бы еще хуже.

1. Adobe Firefly v3

Начнем с любимого всеми Photoshop Beta и его модели Firefly 3. Механика проста: используем функцию генерации «Эталонный объект» (Reference Image), чтобы показать AI, какую одежду мы хотим видеть на модели.

  • Белая футболка: Результат, стоит признать, удивил. Это неплохо. Firefly не "переодел" модель, а сгенерировал новую футболку поверх. Из-за этого строчки на воротнике и рукавах отличаются от оригинала. В целом, для базовой вещи результат вполне приемлемый, но требует доработки.
  • Бордовый бомбер: А вот здесь начинается неконтролируемая импровизация. Вместо цельной куртки нейросеть выдала хаотичные бордовые пятна и сгенерировала собственные странные узоры. Я подумала, что дело в обрезанном кадре, но даже на модели в полный рост Firefly не смог адекватно воссоздать сложный крой.

Вердикт по Firefly: Неплохо справляется с простейшими формами, но полностью проваливает тест на более сложной одежде. Универсальность пока не означает качество.

Кстати, разницу в генерации между Firefly v1 и v3 я рассмотрела на примере галстука в своем Telegram-канале. Заглядывайте, там я часто провожу быстрые тесты и делюсь мыслями.

2. Flux.ai

Эта платформа показала результат лучше, чем Photoshop. Но, как и ожидалось, она полностью перегенерировала саму модель на фото, что является серьезным недостатком.

  • Белая футболка: В целом хорошо. Внешность и прическа модели слегка изменились, но не критично. Сгенерированная вещь похожа на ту, что я давала в качестве референса.
  • Бордовый бомбер: Здесь все сложнее. Первая попытка сгенерировала совершенно другую куртку. Вторая оказалась ближе к правде: куртка бордовая, молния застегнута. Но с карманами произошла беда — они полностью изменились, а сама модель и пропорции ее тела нестабильны от генерации к генерации.

Вердикт по Flux.ai: Мощнее Firefly, но требует нескольких попыток и все равно страдает от нестабильности и потери сходства с оригинальной моделью.

3. ChatGPT

Многого от этой модели я не ожидала, и она оправдала мои опасения. Ее фирменный стиль — "пластмассовая", сглаженная текстура и полностью перерисованная внешность модели.

  • Белая футболка: С базовой задачей ChatGPT справился, но результат выглядит неестественно и пластиково. Для коммерческой фотографии такой вид недопустим.
  • Бордовый бомбер: Куртка села неплохо и даже отдаленно похожа на запрос. Но внешность модели снова изменилась до неузнаваемости, цвет стал более красным, чем на референсе, а вся картинка выглядит так, будто сделана из пластмассы.

Вердикт по ChatGPT: Абсолютно не подходит для реалистичной и точной ретуши. Его результаты слишком далеки от фотографического качества.

4. Pic-Pilot

Последним я протестировала сервис, заточенный специально под fashion e-commerce. Полный функционал доступен только по подписке, но я решила попробовать и его.

Главный плюс: внешность модели практически не изменилась ни на одном фото. Сервис работает без промптов, что упрощает процесс, но снижает контроль.

  • Белая футболка: С переодеванием в базовую футболку модель справилась хорошо, сохранив даже намек на текстуру. Но почему-то изменился крой низа оригинальной одежды, который был на модели до этого.
  • Бордовый бомбер: Здесь Pic-Pilot проявил "самодеятельность". Он предложил два варианта стилизации, добавив аксессуары. Сам бомбер стал расстегнут, рукава — подвернуты. Цвет близок к оригиналу, но результат все равно смущает, так как я хотела не стилизацию, а точное воспроизведение.

Вердикт по Pic-Pilot: Самый продвинутый из всех в плане сохранения модели, но его "творческий" подход и непредсказуемость в стилизации могут мешать при решении конкретных коммерческих задач.

Вывод после всех тестов довольно однозначный:

  1. С базой справляются почти все. Простую белую футболку с горем пополам сгенерирует любая нейросеть.
  2. Со сложным кроем не справился никто. У всех есть серьезные нюансы, от искажения деталей до полной потери сходства. Хуже всех себя показал Adobe Firefly.
  3. Главная проблема — потеря оригинала. Ни одна нейросеть не смогла сохранить исходные характеристики одежды (точный крой, строчки, текстуру, цвет). Модели генерируют похожую вещь, а не редактируют существующую.

Такой результат вряд ли подойдет для серьезного fashion-ритейла, где точность отображения товара — это закон. Возможно, на маркетплейсах для базового гардероба это и можно использовать, но только с серьезной доработкой в Photoshop.

На сегодняшний день качественное "переодевание" модели с помощью AI все еще остается красивой мечтой. Будем следить за технологиями и ждать по-настояшему рабочего решения.

1
Начать дискуссию