Gemini 2.5 Flash против ChatGPT: кто делает картинки лучше

Пока ты ещё обсуждаешь, зачем OpenAI выпустила Sora, интернет уже кипит из-за новой игрушки — Gemini 2.5 Flash (Nano Banana). Пол-TikTok и Reddit сравнивают его с ChatGPT, особенно в генерации и редактировании изображений. Я разобрал баттл от YouTube-канала Zadi, который устроил между ними честное сравнение. Вот что из этого вышло и почему это важно для тех, кто работает с визуальным контентом.

Gemini генерирует быстрее, ChatGPT — аккуратнее. Но когда дело доходит до реальных задач вроде редактирования кадра или имитации стиля, преимущество начинает перетекать то в одну сторону, то в другую. В этой статье покажу, где какая модель выстрелила, где споткнулась, и что это значит для твоего рабочего процесса.

Кстати, я Антон, автор ТГ-канала Шадрин + AI — последнего ТГ-канала про ИИ, который ведётся вручную, а не нейронками.

Zadi начал с простого теста: «фотореалистичный снимок паутины с каплями росы и эффектом боке». Gemini справился за пару секунд и даже дорисовал паука в углу. ChatGPT выдал результат аккуратнее, но медленнее, и без лишних деталей.

Второй тест — женщина с ретро-телефоном на улицах Нью-Йорка. Gemini снова первый и снова точнее попал в атмосферу. Фото от ChatGPT выглядело чище, но менее живым. Тут Gemini побеждает за реализм и скорость.

Вывод: если тебе нужна быстрая генерация с деталями, Gemini выигрывает. Если важна аккуратность и контроль — ChatGPT держит планку.

Третий раунд — имитация стиля Уэса Андерсона. ChatGPT отказался генерировать картинку из-за политики контента, а Gemini спокойно выдал кадр с фирменной симметрией и пастелью. Ещё одно очко в его пользу.

Дальше Zadi попросил обе модели превратить обычное фото в стиль аниме. И вот тут ChatGPT взорвал: идеально перерисовал кадр, сохранив эмоции и композицию. Gemini выдал ноль изменений — будто просто продублировал картинку.

Вывод: Gemini не боится ограничений, но проседает в креативных стилизациях. ChatGPT, наоборот, сильнее в творческих задачах, но упирается в собственные фильтры контента.

Пятое испытание — заменить красный телефон на iPhone и вывеску "hot-dog stand" на "falafel stand". Gemini справился быстро и даже поменял текст вывески. ChatGPT сделал чище и чётче, но слегка изменил фон и персонажей. По качеству Gemini впереди, по аккуратности — почти паритет.

Ещё тест: добавить надпись "Forever" на рукав. Оба справились, но ChatGPT сделал вышивку реалистичнее, хотя снова перекроил часть кадра. Zadi засчитал ничью.

Вывод: Gemini быстрее и стабильнее в точечных правках. ChatGPT детальнее, но иногда меняет больше, чем нужно.

На тесте с UX-прототипом Gemini показал, что держит больше контекста: сохранил элементы, текст и композицию. ChatGPT в какой-то момент потерял куски интерфейса.

А вот в генерации 3D-модели из 2D-картинки ChatGPT наконец взял реванш — создал настоящий 3D-объект, тогда как Gemini выдал просто фотореалистичный рендер.

Вывод: Gemini сильнее в работе со сложными интерфейсами и композициями. ChatGPT — в конвертации форматов и объёмных задачах.

По очкам — Gemini 2.5 Flash побеждает. Он быстрее, стабильнее и точнее в задачах с изображениями и UI-дизайном. ChatGPT выигрывает, когда нужно творчество, стиль и конвертация форматов (аниме, 3D).

Пока что идеального нет. Gemini лучше для рабочих задач: прототипы, редактирование, быстрая генерация. ChatGPT — для креатива, сложных идей и экспериментов со стилями.

Если ты работаешь с визуальным контентом, лучше дружить с обоими.

Gemini 2.5 Flash против ChatGPT: кто делает картинки лучше

Скорость против качества: первый раунд

Имитация стиля: где ChatGPT споткнулся

Редактирование внутри кадра: кто точнее

Конвертация форматов: кто держит контекст

Итоговый счёт: 4:2 в пользу Gemini