Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах
20 ноября состоялся официальный запуск Nano Banana Pro (Gemini-3-Pro-Image-Preview) с мощной базой Gemini 3 Pro. Попробовать можно бесплатно на сайте Gemini и в AI Studio через апи. Мы с вами не только рассмотрим нововведения, почему модель стала прорывной, но и на реальных примерах наглядно в этом убедимся.
Так в чем же именно заключается эволюция Nano Banana?
Nano Banana Pro - это уже не просто «игрушка для генерации изображений», а инструмент посерьезнее, давайте рассмотрим нововведения:
- Более высокое качество вывода: в отличие от оригинальной Nano Banana (с ограничением по скорости до ~1024 пикселей), Nano Banana Pro может генерировать изображения в разрешении 1K, 2K и даже 4K.
- Расширенные возможности рассуждения и интеграции знаний: используя расширенные возможности рассуждения Gemini 3, он может объединять данные поиска в реальном времени (например, погоду, спортивные события) для создания насыщенной контекстом инфографики и даже создания точных образовательных диаграмм. Многоэтапный процесс рассуждения для сложных подсказок + Реальные знания через поиск Google.
- Разборчивый текст на изображениях (многоязычный): Nano Banana Pro решил постоянную проблему искаженного текста на изображениях, создаваемых ИИ. Модель может генерировать высокоточный, легко читаемый текст на нескольких языках, с разными шрифтами и текстурами, и не важно слоганы это или длинные абзацы.
- Управляемость на уровне студии: поддерживает до 14 входных эталонных изображений, сохраняя согласованность для 5 персонажей в сложных композициях. А одновременно с этим открывает регулировку угла наклона камеры, управление фокусным расстоянием и вывод разрешения 4K. Да, вы можете выбрать часть изображения и попросить модель изменить эту часть, или запросом можно попросить поменять соотношение сторон, угол камеры, глубину резкости и освещение.
- В официальных тестах производительности Nano Banana Pro одержал победу в категориях «Преобразование текста в изображение» и «Редактирование изображений», получив оценку New SOTA.
Преобразование текста в изображение - сравнение с другими моделямиРедактирование изображений - сравнение с другими моделями
Это все красивые слова, давайте посмотрим, что может на деле, и почему такой ажиотаж вокруг Nano Banana Pro.
Возможности Nano Banana Pro
Скриншот рабочего стола компьютер
Пользователь X @CaomuQ625 опубликовал сгенерированный скриншот Windows, назвав его пробой пера, так сказать, при этом, большинство моделей генерации изображений до сих пор не могут правильно воспроизвести такой запрос:
Prompt: Создайте снимок экрана рабочего стола операционной системы Windows 11, на котором уже открыт браузер Google Chrome и в окне браузера отображается миниатюра видео Mr. Beast с веб-сайта YouTube.
На мой взгляд, практически идеальная репликация, чрезвычайно высокая точность в интерфейсе Windows 11.
Создание инфографики с текстом
Промпт: Дизайн инфографики в стиле ретро-комиксов 50-х годов. Тема: Как приготовить сухой мартини. Макет включает пошаговое руководство с пронумерованными иллюстрациями. Шаг 1: Стилизованная иллюстрация джина, вермута и большого количества льда. Шаг 2: Стакан для смешивания с барной ложкой, быстро помешивающей коктейль, линии движения обозначают движение. Шаг 3: Классический V-образный коктейльный бокал, через который прозрачная жидкость пропускается через ситечко. Шаг 4: Заключительный снимок готового коктейля с оливкой на палочке, искрящейся. Текстовые надписи жирные и блочные. Цветовая палитра: бирюзовый, горчично-желтый и вишнево-красный. Полутоновые узоры, текстура винтажной бумаги, жирная тушь, выразительные линии.
Nano Banana Pro хорошо поняла информацию, каждое предложение релевантно, и даже включает «WHAM! STIR!», добавляя комиксный вайб. Однако при всем при этом, отсутствует ключевая информация: единицы измерения и соотношение алкоголя, так что такая инфографика все равно пока нецелесообразна для практического обучения. С точки зрения стиля точно воспроизводит стиль американских комиксов, с намеренно состаренной текстурой фоновой бумаги.
Перевод инфографики
Nano Banana Pro прекрасно переводит инфографику и комиксы, при этом если попросить, сохраняет тон предложений и даже подгоняет оформление текста. Был загружен референс и составлен простой запрос:
Переведи мангу на русский язык. Адаптируй шрифты
Изменение стиля изображения
Если в Nano Banana Pro загрузить оригинальное изображение:
И попросить преобразовать его в реалистичное изображение, используя промпт:
Гиперреалистичный групповой портрет актёров сериала «Блич» в суровой экранизации. Снято на IMAX 70 мм, кинематографическое освещение. Персонажи трансформировались в настоящих азиатских актёров с детально проработанной текстурой кожи, порами и небольшими несовершенствами. В центре внимания: Ичиго Куросаки с текстурированными, натурально-оранжевыми колючими волосами и насыщенными карими глазами. Рэндзи Абарай с аутентичными племенными татуировками на лбу и груди, рыжие волосы, собранные в хвост. Кенпачи Зараки с суровым, покрытым шрамами лицом, ужасающим выражением лица и жесткими, торчащими черными волосами. Бякуя, Тоширо и Иккаку в реалистичном стиле. Они одеты в высококачественные фактурные чёрные самурайские кимоно (сихакусё) с белой подкладкой, демонстрирующие реалистичные складки ткани и вес. Грудь обнажает рельефные мышцы. Серьёзные, напряжённые выражения лиц, тёмная атмосфера, малая глубина резкости, разрешение 8K, трассировка лучей.
То вот что выдаст Nano Banana Pro:
Причем, если увеличить изображение, детали не теряются:
Общая эстетика хороша, персонажи отлично переданы, к прорисовке кожи и волос тоже вопросов нет. Banana Pro не "украшает" персонажей, а передает свирепые черты лица, забив на эстетическую привлекательность. Одна из главных проблем в адаптациях манги - «дешевый парик для косплея», а текстура волос в Banana Pro очень реалистична. Поэтому пока Banana Pro на уровень выше всяких SeaDream и даже себя предыдущей)
Способность к рассуждению и многообразный вывод (CN)
Многие не дадут соврать, китайский текст представляет особую сложность при создании большинства моделей ИИ. В этом примере показаны возможности модели в области вывода данных на китайском языке.
По предоставленному скриншоту блюда и короткому промпту нужно создать схему приготовления блюда с продуктами.
Промпт: Создайте схему приготовления свиной отбивной по-гонконгски, показанной на изображении. Схема должна включать простые пошаговые инструкции и быть реалистичной.
Вот оригинальный скриншот:
А вот вывод Nano Banana Pro:
В целом Nano Banana Pro выдала реалистичный процесс приготовления обычного блюда из свиной отбивной с рисом, запеченной в духовке. С точки зрения ингредиентов и этапов приготовления тоже вопросов нет. Отображение сгенерированных ингредиентов, сцен и готового блюда очень реалистично. Мелкие огрехи конечно есть, в виде замены риса с жареного на обычный, но тем не менее, Nano Banana Pro все равно задрала планку.
Вывод:
- Nano Banana Pro стала действительно умнее и реалистичнее. Портреты - где упор на текстуру и естественное освещение, тоже делает отлично, отдельно выделю прорисовку кожи и волос. Отлично преобразовывает изображения в другие стили, особенно анимэ из 2D в 3D, при этом пониамет физические свойства.
- Плюс, модель обрела способность «думать». Благодаря передовым возможностям логического мышления Gemini 3 Pro, Nano Banana Pro может не только создавать красивые изображения, но и способствовать созданию более ценного контента, будь то вывод и создание полной схемы процесса приготовления на основе одного изображения блюда или точное понимание и создание сложных скриншотов рабочего стола компьютера.
- Поддерживает различное соотношение сторон и вывода в высоком разрешении (2K/4K)
- Понимает языки, и переводит без потери смысла и шрифтов. Отдельный бонус, что понимает и не искажает китайский язык - это прям маркер всех ИИ-моделей для создания и редактирования изображений.
Так что, релизы не врут, Nano Banana Pro сделала значительный шаг вперед в плане творчества и практичности, а остальные модели вскоре подтянутся. Вы можете поддержать меня в моем канале НейроProfit - там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы и в целом стараюсь приносить пользу.