Alibaba выкатила Qwen-Image-Edit: Новый AI-редактор фото.
Игорь Телегин на связи! Коллеги, гонка AI-инструментов для редактирования изображений набирает обороты. Не успели мы обсудить FLUX.1 Kontext, как Alibaba (команда Qwen) выкатила своего бойца – Qwen-Image-Edit. Это новая опенсорсная AI-модель для контекстного редактирования картинок, и у нее есть пара очень интересных козырей в рукаве.
Давайте разберем, что это за модель, чем она сильна, и как выглядит на фоне своего главного конкурента, FLUX.
Что такое Qwen-Image-Edit?
Если коротко, Qwen-Image-Edit – это диффузионная AI-модель (20 млрд параметров), созданная для того, чтобы вносить изменения в существующие изображения по текстовому промпту. Она использует "двойной контроль": модель Qwen-2.5-VL "понимает" общую сцену на картинке, а VAE-энкодер отвечает за визуальную часть.
Главное, что нужно знать – это опенсорсная модель, которую энтузиасты уже могут запускать локально, например, в ComfyUI.
Главная фишка: Идеальный текст на картинках (включая китайский!)
Вот где Qwen-Image-Edit, судя по первым тестам, действительно сияет. Это одна из немногих моделей, которая отлично справляется с редактированием и добавлением текста прямо на изображениях, особенно на английском и китайском языках. Текст получается четким, естественным и хорошо вписывается в картинку. Для многих дизайнеров и маркетологов, которые мучаются с текстом в Midjourney или DALL-E, это может стать настоящим спасением.
Qwen-Image-Edit vs. Flux Context: Битва титанов "на минималках"
Чтобы понять реальные возможности, интересно посмотреть, как Qwen-Image-Edit выглядит на фоне FLUX.1 Kontext (похожей модели для контекстного редактирования).
Задача: Взять изображение мотоцикла с человеком и изменить цвет байка на красный, сохранив при этом все логотипы.
- Скорость: Flux оказался почти в два раза быстрее (6 сек против 11 сек на 10 шагах семплинга).
- Качество и следование промпту: Обе модели отлично справились с основной задачей – изменили цвет и сохранили логотипы. Обе даже проявили "креативность", поменяв цвет одного из логотипов с оранжевого на желтый, чтобы он лучше сочетался с красным.
- Но дьявол в деталях:Flux Context выдал более качественную и четкую картинку. Персонаж и мелкие детали на байке выглядят лучше.Qwen-Image-Edit, по отзывам, выдал результат с "пикселизацией", особенно на фигуре человека. Возможно, это можно исправить настройками семплера, но "из коробки" результат уступает.
Итог: У каждого своя сильная сторона
Вырисовывается интересная картина:
- Хотите редактировать персонажей и получать максимальное визуальное качество? Ваш выбор, скорее всего, Flux Context.
- Ваша главная задача – работа с текстом на изображениях (особенно многоязычным)? Здесь Qwen-Image-Edit показывает себя как один из лучших инструментов на рынке.
- Нужно редактировать расположение объектов? Некоторые пользователи отмечают, что Qwen иногда справляется с этим даже лучше.
Получается классическая ситуация "что-то за что-то". Нет одной идеальной модели, есть инструменты под разные задачи. Qwen-Image-Edit – это не "убийца" всего и вся, а мощный и, что важно, опенсорсный инструмент со своей уникальной специализацией.
Самые свежие обзоры AI-инструментов и ссылки в Telegram!