GPT Image 2 вышел сегодня. Разобрал за несколько часов - вот что реально изменилось
OpenAI сегодня выпустила ChatGPT Images 2.0 на базе gpt-image-2. Я провёл несколько часов с моделью и хочу рассказать не про маркетинговые тезисы, а про то, что реально ощущается иначе.
Текст на изображениях теперь работает
Все, кто пробовал генерировать постеры, карточки товаров или UI-макеты в DALL-E или Midjourney, знают эту боль. Надписи выходили кривыми, буквы плавали, слова превращались в случайный набор символов.
GPT Image 2 заявляет точность рендеринга текста 99%. На практике это выглядит так:
Create an ultra-realistic, highly detailed front page of a late-1960s American newspaper, styled like a classic broadsheet from February 30, 1969, with authentic 1969 newspaper design, typography, layout, printing imperfections, and aged newsprint texture. The page should look like a real archival newspaper photographed in studio lighting. Main masthead: "The New York Times" in a classic vintage serif newspaper style, black ink on off-white aged paper. Dense multi-column layout, narrow justified text columns, small captions, tiny subheads, realistic page wear, slight yellowing, folded creases, faint ink bleed, halftone photo dots, and subtle printing misregistration. Lead story 1: a massive dramatic headline about humans building a city on Mars, with a large black-and-white documentary-style photograph showing astronauts, futuristic domes, construction machinery, and workers assembling buildings on the Martian surface. The image should feel like a real 1969 press photo, gritty, believable, and historically styled. Headline text: "HUMANITY BUILDS FIRST CITY ON MARS" Subheadline: "Permanent settlement expands beyond Earth as the red planet enters a new era." Lead story 2: a major international headline about the Roman Empire returning to Europe, presented as a serious geopolitical event with an old-world yet realistic tone. Headline text: "ROME DECLARES THE RETURN OF THE EMPIRE ACROSS EUROPE" Subheadline: "Ancient imperial institutions restored as capitals react with shock and ceremony." Lead story 3: a major headline about Russia undergoing a revolution and becoming a libertarian country, the freest and most prosperous in the world, written like a serious geopolitical transformation. Headline text: "RUSSIA TRANSFORMS INTO THE WORLD'S FREEST LIBERTARIAN NATION" Subheadline: "Sweeping reforms reshape the state into a prosperous, radically open society." Add smaller realistic side stories, stock market snippets, weather box, editorial column, classified ads, tiny wartime-style maps, and a few believable local headlines to make the page feel authentic and crowded. Use period-correct 1960s newspaper design, no modern UI elements, no color, no glossy effects. The entire newspaper should feel like a genuine, physically printed historical artifact, highly convincing at a glance, with cinematic realism, documentary authenticity, and editorial credibility.
Модель теперь думает перед тем, как рисовать
Это архитектурное изменение, и оно чувствуется. Раньше нейросеть просто интерпретировала запрос и рендерила. Теперь анализирует, может сгенерировать до 8 вариантов из одного промпта и выбрать лучший. На сложных задачах это заметно.
Разрешение и согласованность
2K в стандарте, 4K через API. Персонаж сохраняет внешность между несколькими изображениями — это важно для сторителлинга, комиксов, брендовых материалов.
Где не дотягивает
OpenAI честно признаёт ограничения: сложные физические сцены (оригами, объекты под углом), очень мелкие повторяющиеся детали. Русскоязычный текст на изображениях работает лучше, чем раньше, но в официальный список улучшенных языков кириллица пока не попала.
Кому это реально меняет рабочий процесс
Контент-командам - обложки, превью, баннеры без фотостока. Продакт-дизайнерам - быстрые прототипы для обсуждения с командой. Маркетологам - карточки товаров, рекламные макеты с нормальным текстом.
Это не замена дизайнера на сложных проектах. Но для задач "нужен визуал к понедельнику" - разрыв между нейросетью и фрилансером сократился ещё заметнее.
Написал подробный разбор с промптами, таблицей возможностей и честными ограничениями на newscroll.ru
Кто уже попробовал - как ощущения по сравнению с предыдущими версиями?