Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

20 ноября состоялся официальный запуск Nano Banana Pro (Gemini-3-Pro-Image-Preview) с мощной базой Gemini 3 Pro. Попробовать можно бесплатно на сайте Gemini и в AI Studio через апи. Мы с вами не только рассмотрим нововведения, почему модель стала прорывной, но и на реальных примерах наглядно в этом убедимся.

Так в чем же именно заключается эволюция Nano Banana?

Nano Banana Pro - это уже не просто «игрушка для генерации изображений», а инструмент посерьезнее, давайте рассмотрим нововведения:

  • Более высокое качество вывода: в отличие от оригинальной Nano Banana (с ограничением по скорости до ~1024 пикселей), Nano Banana Pro может генерировать изображения в разрешении 1K, 2K и даже 4K.
  • Расширенные возможности рассуждения и интеграции знаний: используя расширенные возможности рассуждения Gemini 3, он может объединять данные поиска в реальном времени (например, погоду, спортивные события) для создания насыщенной контекстом инфографики и даже создания точных образовательных диаграмм. Многоэтапный процесс рассуждения для сложных подсказок + Реальные знания через поиск Google.
  • Разборчивый текст на изображениях (многоязычный): Nano Banana Pro решил постоянную проблему искаженного текста на изображениях, создаваемых ИИ. Модель может генерировать высокоточный, легко читаемый текст на нескольких языках, с разными шрифтами и текстурами, и не важно слоганы это или длинные абзацы.
  • Управляемость на уровне студии: поддерживает до 14 входных эталонных изображений, сохраняя согласованность для 5 персонажей в сложных композициях. А одновременно с этим открывает регулировку угла наклона камеры, управление фокусным расстоянием и вывод разрешения 4K. Да, вы можете выбрать часть изображения и попросить модель изменить эту часть, или запросом можно попросить поменять соотношение сторон, угол камеры, глубину резкости и освещение.
  • В официальных тестах производительности Nano Banana Pro одержал победу в категориях «Преобразование текста в изображение» и «Редактирование изображений», получив оценку New SOTA.

Преобразование текста в изображение - сравнение с другими моделямиРедактирование изображений - сравнение с другими моделями

Это все красивые слова, давайте посмотрим, что может на деле, и почему такой ажиотаж вокруг Nano Banana Pro.

Возможности Nano Banana Pro

Скриншот рабочего стола компьютер

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Пользователь X @CaomuQ625 опубликовал сгенерированный скриншот Windows, назвав его пробой пера, так сказать, при этом, большинство моделей генерации изображений до сих пор не могут правильно воспроизвести такой запрос:

Prompt: Создайте снимок экрана рабочего стола операционной системы Windows 11, на котором уже открыт браузер Google Chrome и в окне браузера отображается миниатюра видео Mr. Beast с веб-сайта YouTube.

На мой взгляд, практически идеальная репликация, чрезвычайно высокая точность в интерфейсе Windows 11.

Создание инфографики с текстом

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Промпт: Дизайн инфографики в стиле ретро-комиксов 50-х годов. Тема: Как приготовить сухой мартини. Макет включает пошаговое руководство с пронумерованными иллюстрациями. Шаг 1: Стилизованная иллюстрация джина, вермута и большого количества льда. Шаг 2: Стакан для смешивания с барной ложкой, быстро помешивающей коктейль, линии движения обозначают движение. Шаг 3: Классический V-образный коктейльный бокал, через который прозрачная жидкость пропускается через ситечко. Шаг 4: Заключительный снимок готового коктейля с оливкой на палочке, искрящейся. Текстовые надписи жирные и блочные. Цветовая палитра: бирюзовый, горчично-желтый и вишнево-красный. Полутоновые узоры, текстура винтажной бумаги, жирная тушь, выразительные линии.

Nano Banana Pro хорошо поняла информацию, каждое предложение релевантно, и даже включает «WHAM! STIR!», добавляя комиксный вайб. Однако при всем при этом, отсутствует ключевая информация: единицы измерения и соотношение алкоголя, так что такая инфографика все равно пока нецелесообразна для практического обучения. С точки зрения стиля точно воспроизводит стиль американских комиксов, с намеренно состаренной текстурой фоновой бумаги.

Перевод инфографики

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Nano Banana Pro прекрасно переводит инфографику и комиксы, при этом если попросить, сохраняет тон предложений и даже подгоняет оформление текста. Был загружен референс и составлен простой запрос:

Переведи мангу на русский язык. Адаптируй шрифты

Изменение стиля изображения

Если в Nano Banana Pro загрузить оригинальное изображение:

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

И попросить преобразовать его в реалистичное изображение, используя промпт:

Гиперреалистичный групповой портрет актёров сериала «Блич» в суровой экранизации. Снято на IMAX 70 мм, кинематографическое освещение. Персонажи трансформировались в настоящих азиатских актёров с детально проработанной текстурой кожи, порами и небольшими несовершенствами. В центре внимания: Ичиго Куросаки с текстурированными, натурально-оранжевыми колючими волосами и насыщенными карими глазами. Рэндзи Абарай с аутентичными племенными татуировками на лбу и груди, рыжие волосы, собранные в хвост. Кенпачи Зараки с суровым, покрытым шрамами лицом, ужасающим выражением лица и жесткими, торчащими черными волосами. Бякуя, Тоширо и Иккаку в реалистичном стиле. Они одеты в высококачественные фактурные чёрные самурайские кимоно (сихакусё) с белой подкладкой, демонстрирующие реалистичные складки ткани и вес. Грудь обнажает рельефные мышцы. Серьёзные, напряжённые выражения лиц, тёмная атмосфера, малая глубина резкости, разрешение 8K, трассировка лучей.

То вот что выдаст Nano Banana Pro:

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Причем, если увеличить изображение, детали не теряются:

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

Общая эстетика хороша, персонажи отлично переданы, к прорисовке кожи и волос тоже вопросов нет. Banana Pro не "украшает" персонажей, а передает свирепые черты лица, забив на эстетическую привлекательность. Одна из главных проблем в адаптациях манги - «дешевый парик для косплея», а текстура волос в Banana Pro очень реалистична. Поэтому пока Banana Pro на уровень выше всяких SeaDream и даже себя предыдущей)

Способность к рассуждению и многообразный вывод (CN)

Многие не дадут соврать, китайский текст представляет особую сложность при создании большинства моделей ИИ. В этом примере показаны возможности модели в области вывода данных на китайском языке.

По предоставленному скриншоту блюда и короткому промпту нужно создать схему приготовления блюда с продуктами.

Промпт: Создайте схему приготовления свиной отбивной по-гонконгски, показанной на изображении. Схема должна включать простые пошаговые инструкции и быть реалистичной.

Вот оригинальный скриншот:

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

А вот вывод Nano Banana Pro:

Nano Banana Pro - почему это прорывная модель генерации и редактирования изображений? Проверяем на реальных примерах

В целом Nano Banana Pro выдала реалистичный процесс приготовления обычного блюда из свиной отбивной с рисом, запеченной в духовке. С точки зрения ингредиентов и этапов приготовления тоже вопросов нет. Отображение сгенерированных ингредиентов, сцен и готового блюда очень реалистично. Мелкие огрехи конечно есть, в виде замены риса с жареного на обычный, но тем не менее, Nano Banana Pro все равно задрала планку.

Вывод:

  • Nano Banana Pro стала действительно умнее и реалистичнее. Портреты - где упор на текстуру и естественное освещение, тоже делает отлично, отдельно выделю прорисовку кожи и волос. Отлично преобразовывает изображения в другие стили, особенно анимэ из 2D в 3D, при этом пониамет физические свойства.
  • Плюс, модель обрела способность «думать». Благодаря передовым возможностям логического мышления Gemini 3 Pro, Nano Banana Pro может не только создавать красивые изображения, но и способствовать созданию более ценного контента, будь то вывод и создание полной схемы процесса приготовления на основе одного изображения блюда или точное понимание и создание сложных скриншотов рабочего стола компьютера.
  • Поддерживает различное соотношение сторон и вывода в высоком разрешении (2K/4K)
  • Понимает языки, и переводит без потери смысла и шрифтов. Отдельный бонус, что понимает и не искажает китайский язык - это прям маркер всех ИИ-моделей для создания и редактирования изображений.

Так что, релизы не врут, Nano Banana Pro сделала значительный шаг вперед в плане творчества и практичности, а остальные модели вскоре подтянутся. Вы можете поддержать меня в моем канале НейроProfit - там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы и в целом стараюсь приносить пользу.

Начать дискуссию