ТЕСТ НЕЙРОСЕТИ, КОТОРАЯ ПЫТАЕТСЯ ПЕРЕПЛЮНУТЬ NANO BANANA PRO (Wan 2.7)
Я прогнала модель в нескольких сценариях: фото по текстовому описанию, генерация с товаром, сохранение внешности в одиночных кадрах и в групповом фото.
Сразу скажу главное: Wan 2.7 умеет делать визуально приятные картинки, но с точностью у нее все не так ровно. Особенно там, где нужно не просто собрать красивый кадр, а действительно сохранить конкретного человека.
Разбираю по пунктам.
1. Сохранение внешности. Результат неоднозначный. Один кадр получился более-менее удачным: лицо выглядит цельно, кадр собран хорошо, нет откровенного развала по анатомии или свету. Но второй тест показывает главное слабое место модели - стабильности нет.
Если в одном случае внешность еще можно принять, то в другом это уже фактически другой человек. Меняются ощущение возраста, типаж, черты лица, иногда даже общее впечатление от внешности. То есть Wan не держит лицо как фиксированную сущность, а скорее каждый раз пересобирает его под сцену.
В групповых фото начинаются серьезные проблемы. В групповых кадрах модель хуже держит лица, и это видно сразу. Она скорее сохраняет общую сцену, настроение, одежду, позы и стилистику, чем самих людей.
Для задач, где критична узнаваемость, надежной я бы эту модель не назвала.
2. Фото с товаром. Вот здесь Wan 2.7 показала себя заметно лучше. Товар не развалился, форма сумки сохранена хорошо, материал читается, металлическая фурнитура выглядит уверенно, композицию модель держит. Видно, что она неплохо понимает подачу ракурс и акцент на объекте. Для генерации фото с товаром Wan 2.7 вполне можно рассматривать как рабочий инструмент.
3. Фото по текстовому описанию. Здесь результат получился неплохим, но не без нюансов. Кадр выглядит аккуратно: приятный свет, чистая композиция, нормальная проработка кожи, волос и ткани. В целом модель умеет собирать красивую картинку по описанию. По общему уровню реализма модель, конечно, пока не дотягивает до Banana, но результат хороший и его можно доработать через апскеил.
Wan 2.7 - это модель больше про красивую сборку кадра. Она может выдать хороший свет, нормальную композицию, приятную фактуру и достойную подачу товара. Но как только задача становится сложнее - сохранить конкретную внешность, тем более в группе, результат быстро начинает плыть.
Читайте также:
Если тебе интересны нейросети и хочешь быть в курсе последних событий из мира ИИ, присоединяйся к моему телеграм-каналу. Там я тестирую и сравниваю нейросети, делюсь промптами и полезными инструментами.