Nano banana pro, что реально изменилось
Пока люди развлекаются на создании фейковых скриншотов, я проверил новый банан на задачах, с которыми прошлая версия справлялась плохо. И у новой модели есть несколько винов и один фэйл.
Упрощение запросов для редактирования
Чем больше развиваются нейронки, тем проще составлять запросы. Помните, была такая профессия, промпт-инженер? Самая короткоживующая профессия за всю историю. Подборки промптов тоже можете удалять из закладок, они устаревают быстрее, чем вы успеваете их попробовать.
Сейчас буквально пишите, что нужно получить без всяких правил и получаете это. Нейронка понимает взаимное расположение объектов, перспективу, абстрактные понятия. Нужно отредактировать одного человека из пяти - коротко описываете его, пишите "пусть мужчина в гавайской рубашке и белых шортах поднимет руку". Или "убери третий чайник слева, оставь там пустое место".
Например, раньше в запросе нужно было указывать конкретное действие в виде глагола. Если банана плохо справлялась с редактированием изображения, нужно было ей прям писать: "сгенерируй новое изображение на основе данного, где..." Как видно из примеров ниже, теперь нейронка понимает с полуслова.
Также раньше при редактировании изображения нужно было прописывать не только, что менять, а что не менять. Например: отреставрируй это фото, не меняя ничего на нём. Теперь это лишнее. Пишем, что делать и в 9 случаях из 10 нейронка делает только то, что ей сказали без самоуправства.
В общем, запросы стали сильно проще, мясные мозги напрягаются всё меньше.
Управление камерой
Изображение можно крутить как угодно. Предыдущая версия очень плохо работала с перемещением камеры. В новой версии достаточно сказать, как переместить камеру без проговаривания того, что эта камера должна увидеть:
И самое сложное, с чем банана не могла справиться раньше вообще - вид от отдельных предметов. Пример для нижнего изображения: view from the bottom of the metal box vertically upwards.
Есть некоторые косяки, но они поправимы. В целом, это вин.
Замена лиц
Раньше справлялось очень плохо, особенно, если лица были примерно похожи. А если на картинке несколько людей и надо заменить одно, туши свет. Теперь это просто - описываем у какого человека менять лицо, нейронка это делает:
Пример: где меняем, на что меняем, результат:
Хардкор: абстрактные объекты и сложные операции с ними.
У меня был тест, который проваливали все нейронки. Банана про - первая, что сдала его с первой попытки. Хочу ленту мёбиуса из джинсы, по поверхности которой идёт красная металлическая труба. Ещё полгода назад у всех нейронок была проблема просто нарисовать ленту мёбиуса, а теперь:
Я вам ещё раз покажу, чтобы вы впечатлились - нейронка нарисовала корректную ленту мёбиуса из случайного материала и правильно расположила на её поверхности объект. Вот настолько она теперь понимает абстракции и перспективу.
В этом месте самым скептически настроенным художникам уже следует напрячься.
Для сравнения, результат базовой, не pro, модели по тому же запросу:
Работа с цветом, контрастом, реставрация фото
А вот в плане цветокоррекции и реставрации фото всё очень плохо, как и в прошлой модели. Новая банана на этом поле сливает flux.kontext, которая может исправлять косяки с цветом, контрастом (или корректировать их в заданном направлении), улучшать резкость. Я перепробовал кучу разных запросов, и больших и конкретных и простых, изображения получаются неестественные, результат всегда хуже ручной обработки, фотографы могут ещё поработать.