GPT Image 2 вышел сегодня. Разобрал за несколько часов - вот что реально изменилось

ChatGPT Images 2.0
ChatGPT Images 2.0

OpenAI сегодня выпустила ChatGPT Images 2.0 на базе gpt-image-2. Я провёл несколько часов с моделью и хочу рассказать не про маркетинговые тезисы, а про то, что реально ощущается иначе.

Текст на изображениях теперь работает

Все, кто пробовал генерировать постеры, карточки товаров или UI-макеты в DALL-E или Midjourney, знают эту боль. Надписи выходили кривыми, буквы плавали, слова превращались в случайный набор символов.

GPT Image 2 заявляет точность рендеринга текста 99%. На практике это выглядит так:

Create an ultra-realistic, highly detailed front page of a late-1960s American newspaper, styled like a classic broadsheet from February 30, 1969, with authentic 1969 newspaper design, typography, layout, printing imperfections, and aged newsprint texture. The page should look like a real archival newspaper photographed in studio lighting. Main masthead: "The New York Times" in a classic vintage serif newspaper style, black ink on off-white aged paper. Dense multi-column layout, narrow justified text columns, small captions, tiny subheads, realistic page wear, slight yellowing, folded creases, faint ink bleed, halftone photo dots, and subtle printing misregistration. Lead story 1: a massive dramatic headline about humans building a city on Mars, with a large black-and-white documentary-style photograph showing astronauts, futuristic domes, construction machinery, and workers assembling buildings on the Martian surface. The image should feel like a real 1969 press photo, gritty, believable, and historically styled. Headline text: "HUMANITY BUILDS FIRST CITY ON MARS" Subheadline: "Permanent settlement expands beyond Earth as the red planet enters a new era." Lead story 2: a major international headline about the Roman Empire returning to Europe, presented as a serious geopolitical event with an old-world yet realistic tone. Headline text: "ROME DECLARES THE RETURN OF THE EMPIRE ACROSS EUROPE" Subheadline: "Ancient imperial institutions restored as capitals react with shock and ceremony." Lead story 3: a major headline about Russia undergoing a revolution and becoming a libertarian country, the freest and most prosperous in the world, written like a serious geopolitical transformation. Headline text: "RUSSIA TRANSFORMS INTO THE WORLD'S FREEST LIBERTARIAN NATION" Subheadline: "Sweeping reforms reshape the state into a prosperous, radically open society." Add smaller realistic side stories, stock market snippets, weather box, editorial column, classified ads, tiny wartime-style maps, and a few believable local headlines to make the page feel authentic and crowded. Use period-correct 1960s newspaper design, no modern UI elements, no color, no glossy effects. The entire newspaper should feel like a genuine, physically printed historical artifact, highly convincing at a glance, with cinematic realism, documentary authenticity, and editorial credibility.

Промпт
GPT Image 2 вышел сегодня. Разобрал за несколько часов - вот что реально изменилось

Модель теперь думает перед тем, как рисовать

Это архитектурное изменение, и оно чувствуется. Раньше нейросеть просто интерпретировала запрос и рендерила. Теперь анализирует, может сгенерировать до 8 вариантов из одного промпта и выбрать лучший. На сложных задачах это заметно.

Half-Life 3 
Half-Life 3 

Разрешение и согласованность

2K в стандарте, 4K через API. Персонаж сохраняет внешность между несколькими изображениями — это важно для сторителлинга, комиксов, брендовых материалов.

Где не дотягивает

OpenAI честно признаёт ограничения: сложные физические сцены (оригами, объекты под углом), очень мелкие повторяющиеся детали. Русскоязычный текст на изображениях работает лучше, чем раньше, но в официальный список улучшенных языков кириллица пока не попала.

Кому это реально меняет рабочий процесс

Контент-командам - обложки, превью, баннеры без фотостока. Продакт-дизайнерам - быстрые прототипы для обсуждения с командой. Маркетологам - карточки товаров, рекламные макеты с нормальным текстом.

Это не замена дизайнера на сложных проектах. Но для задач "нужен визуал к понедельнику" - разрыв между нейросетью и фрилансером сократился ещё заметнее.

Написал подробный разбор с промптами, таблицей возможностей и честными ограничениями на newscroll.ru

Кто уже попробовал - как ощущения по сравнению с предыдущими версиями?

7
1
10 комментариев