Alibaba выкатила Qwen-Image-Edit: Новый AI-редактор фото.

Игорь Телегин на связи! Коллеги, гонка AI-инструментов для редактирования изображений набирает обороты. Не успели мы обсудить FLUX.1 Kontext, как Alibaba (команда Qwen) выкатила своего бойца – Qwen-Image-Edit. Это новая опенсорсная AI-модель для контекстного редактирования картинок, и у нее есть пара очень интересных козырей в рукаве.

Давайте разберем, что это за модель, чем она сильна, и как выглядит на фоне своего главного конкурента, FLUX.

Что такое Qwen-Image-Edit?

Если коротко, Qwen-Image-Edit – это диффузионная AI-модель (20 млрд параметров), созданная для того, чтобы вносить изменения в существующие изображения по текстовому промпту. Она использует "двойной контроль": модель Qwen-2.5-VL "понимает" общую сцену на картинке, а VAE-энкодер отвечает за визуальную часть.

Главное, что нужно знать – это опенсорсная модель, которую энтузиасты уже могут запускать локально, например, в ComfyUI.

Главная фишка: Идеальный текст на картинках (включая китайский!)

Вот где Qwen-Image-Edit, судя по первым тестам, действительно сияет. Это одна из немногих моделей, которая отлично справляется с редактированием и добавлением текста прямо на изображениях, особенно на английском и китайском языках. Текст получается четким, естественным и хорошо вписывается в картинку. Для многих дизайнеров и маркетологов, которые мучаются с текстом в Midjourney или DALL-E, это может стать настоящим спасением.

Qwen-Image-Edit vs. Flux Context: Битва титанов "на минималках"

Чтобы понять реальные возможности, интересно посмотреть, как Qwen-Image-Edit выглядит на фоне FLUX.1 Kontext (похожей модели для контекстного редактирования).

Задача: Взять изображение мотоцикла с человеком и изменить цвет байка на красный, сохранив при этом все логотипы.

  • Скорость: Flux оказался почти в два раза быстрее (6 сек против 11 сек на 10 шагах семплинга).
  • Качество и следование промпту: Обе модели отлично справились с основной задачей – изменили цвет и сохранили логотипы. Обе даже проявили "креативность", поменяв цвет одного из логотипов с оранжевого на желтый, чтобы он лучше сочетался с красным.
  • Но дьявол в деталях:Flux Context выдал более качественную и четкую картинку. Персонаж и мелкие детали на байке выглядят лучше.Qwen-Image-Edit, по отзывам, выдал результат с "пикселизацией", особенно на фигуре человека. Возможно, это можно исправить настройками семплера, но "из коробки" результат уступает.

Итог: У каждого своя сильная сторона

Вырисовывается интересная картина:

  • Хотите редактировать персонажей и получать максимальное визуальное качество? Ваш выбор, скорее всего, Flux Context.
  • Ваша главная задача – работа с текстом на изображениях (особенно многоязычным)? Здесь Qwen-Image-Edit показывает себя как один из лучших инструментов на рынке.
  • Нужно редактировать расположение объектов? Некоторые пользователи отмечают, что Qwen иногда справляется с этим даже лучше.

Получается классическая ситуация "что-то за что-то". Нет одной идеальной модели, есть инструменты под разные задачи. Qwen-Image-Edit – это не "убийца" всего и вся, а мощный и, что важно, опенсорсный инструмент со своей уникальной специализацией.

Самые свежие обзоры AI-инструментов и ссылки в Telegram!

1
Начать дискуссию