FLUX.2 - конкурент NANO BANANA PRO?

Black Forest Labs выпустили FLUX.2

— флагманскую модель для генерации изображений с серьёзными улучшениями по всем фронтам. Модель позиционируется как опенсорс-конкурент Google Nano Banana 2 и действительно впечатляет возможностями

Ключевые фичи

Мультиреференс:

Replace the children in the image with the animals from images 2, 3, 4, 5, and 6.
Replace the children in the image with the animals from images 2, 3, 4, 5, and 6.

До 10 изображений одновременно для контроля персонажей, продуктов и стиля. Можно зафиксировать модель, продукт, ракурс камеры, освещение или всё сразу — и генерировать серию консистентных изображений.

Фотореализм и детализация:

Use the empty illuminated concrete space from the first image as the room, place all the furniture from the images inside this space, and use the purple knit texture from the uploaded image to create a blanket draped over the red chair.
Use the empty illuminated concrete space from the first image as the room, place all the furniture from the images inside this space, and use the purple knit texture from the uploaded image to create a blanket draped over the red chair.

Более чёткие текстуры, стабильное освещение и честная физика света. Модель наконец научилась нормально рендерить руки, лица, ткани, логотипы и мелкие объекты, которые обычно проваливают другие генераторы.

Рендеринг текста:

Сложная типографика, инфографика, мемы и UI-макеты теперь работают стабильно. Текст в продакшене больше не проблема.

Улучшенное следование промптам:

FLUX.2 - конкурент NANO BANANA PRO?

Модель лучше понимает сложные структурированные инструкции, включая многокомпонентные промпты и композиционные ограничения. Есть поддержка JSON-промптинга для профи.

Технические детали

Вес модели — главная боль. FP16-версия весит 64 Гб, FP8 — 35,5 Гб. Но NVIDIA совместно с Black Forest Labs и ComfyUI оптимизировали модель: FP8-квантизация снижает требования к VRAM на 40% и ускоряет генерацию на 40%.

На Reddit пользователи отмечают стабильную работу на RTX 3090 и 4090. Модель доступна в ComfyUI без дополнительного софта.

Версии модели

FLUX.2 Dev — опенсорс-версия для экспериментов, легче, проще запустить локально, полная поддержка обучения LoRA. Идеальна для исследователей и разработчиков, которые хотят файнтюнить модель под свои задачи.

FLUX.2 Flex — кастомизируемая версия с ручной настройкой шагов, guidance и других параметров. Более сильный рендеринг типографики, поддержка до 10 референсных изображений с общим входным объёмом до 14 Мп.

Где тестировать?

Модель доступна на всех основных платформах: Fal.ai, Freepik, Replicate, Hugging Face Spaces, Cloudflare Workers AI. Официальный playground: playground.bfl.ai

Веса доступны на Hugging Face: huggingface.co/black-forest-labs

Первые впечатления

По графикам с официального сайта FLUX.2 Dev должен превосходить Nano Banana 1, Seed Dream 4 и FLUX Kontext, немного уступая только Nano Banana 2. На практике пользователи отмечают сильную консистентность персонажей и даже сохранение освещения, хотя Nano Banana 2 пока держит планку по общему качеству.

The jar in image 1 is filled with capsules exactly same as image 2 with the exact logo
The jar in image 1 is filled with capsules exactly same as image 2 with the exact logo

Главный вопрос — дальнейшая судьба модели. FLUX.2 требует серьёзных ресурсов даже для генерации на топовых картах, а тренировка LoRA на локальных ПК скорее всего будет недоступна. Комьюнити на Civitai уже начало работу над LoRA, но обилия кастомных моделей ждать пока не стоит из-за высоких требований к железу.

5
Начать дискуссию