Nano banana pro, что реально изменилось

Пока люди развлекаются на создании фейковых скриншотов, я проверил новый банан на задачах, с которыми прошлая версия справлялась плохо. И у новой модели есть несколько винов и один фэйл.

Чем больше развиваются нейронки, тем проще составлять запросы. Помните, была такая профессия, промпт-инженер? Самая короткоживующая профессия за всю историю. Подборки промптов тоже можете удалять из закладок, они устаревают быстрее, чем вы успеваете их попробовать.

Сейчас буквально пишите, что нужно получить без всяких правил и получаете это. Нейронка понимает взаимное расположение объектов, перспективу, абстрактные понятия. Нужно отредактировать одного человека из пяти - коротко описываете его, пишите "пусть мужчина в гавайской рубашке и белых шортах поднимет руку". Или "убери третий чайник слева, оставь там пустое место".

Например, раньше в запросе нужно было указывать конкретное действие в виде глагола. Если банана плохо справлялась с редактированием изображения, нужно было ей прям писать: "сгенерируй новое изображение на основе данного, где..." Как видно из примеров ниже, теперь нейронка понимает с полуслова.

Также раньше при редактировании изображения нужно было прописывать не только, что менять, а что не менять. Например: отреставрируй это фото, не меняя ничего на нём. Теперь это лишнее. Пишем, что делать и в 9 случаях из 10 нейронка делает только то, что ей сказали без самоуправства.

В общем, запросы стали сильно проще, мясные мозги напрягаются всё меньше.

Изображение можно крутить как угодно. Предыдущая версия очень плохо работала с перемещением камеры. В новой версии достаточно сказать, как переместить камеру без проговаривания того, что эта камера должна увидеть:

camera orbit left around subject by 45 degrees camera orbit up around subject by 45 degrees view from above, bird's eye view view from ground level, worms's eye view

И самое сложное, с чем банана не могла справиться раньше вообще - вид от отдельных предметов. Пример для нижнего изображения: view from the bottom of the metal box vertically upwards.

Есть некоторые косяки, но они поправимы. В целом, это вин.

Раньше справлялось очень плохо, особенно, если лица были примерно похожи. А если на картинке несколько людей и надо заменить одно, туши свет. Теперь это просто - описываем у какого человека менять лицо, нейронка это делает:

Replace the face of the man in dark clothes in the first uploaded image with the face from the second uploaded image.

Пример: где меняем, на что меняем, результат:

У меня был тест, который проваливали все нейронки. Банана про - первая, что сдала его с первой попытки. Хочу ленту мёбиуса из джинсы, по поверхности которой идёт красная металлическая труба. Ещё полгода назад у всех нейронок была проблема просто нарисовать ленту мёбиуса, а теперь:

Mobius strip made of denim. A red metal tube runs along the ribbon's surface in the center. The background is light gray.

Я вам ещё раз покажу, чтобы вы впечатлились - нейронка нарисовала корректную ленту мёбиуса из случайного материала и правильно расположила на её поверхности объект. Вот настолько она теперь понимает абстракции и перспективу.

В этом месте самым скептически настроенным художникам уже следует напрячься.

Для сравнения, результат базовой, не pro, модели по тому же запросу:

А вот в плане цветокоррекции и реставрации фото всё очень плохо, как и в прошлой модели. Новая банана на этом поле сливает flux.kontext, которая может исправлять косяки с цветом, контрастом (или корректировать их в заданном направлении), улучшать резкость. Я перепробовал кучу разных запросов, и больших и конкретных и простых, изображения получаются неестественные, результат всегда хуже ручной обработки, фотографы могут ещё поработать.

Nano banana pro, что реально изменилось

Упрощение запросов для редактирования

Управление камерой

Замена лиц

Хардкор: абстрактные объекты и сложные операции с ними.

Работа с цветом, контрастом, реставрация фото