Обзор нового GPT-image-1.5. Лица теперь очень точны. Как правильно генерить изображения, промты от разрабов.

С выходом GPT-image-1.5 стало понятно, что генерация изображений постепенно уходит к предсказуемому процессу. Вместе с моделью OpenAI опубликовала подробный Prompting Guide, который фактически задаёт правила работы с визуальными запросами: как формулировать инструкции, чего ожидать от модели.

Обзор нового GPT-image-1.5. Лица теперь очень точны. Как правильно генерить изображения, промты от разрабов.

Этот гайд интересен не только дизайнерам, но и разработчикам, которые используют генерацию изображений в продуктах, маркетинге или автоматизированных пайплайнах.

Ключевая идея гайда: модель следует инструкции, а не «догадывается»

OpenAI прямо рекомендует избегать абстрактных формулировок вроде «сделай красивее» или «добавь стиль». Вместо этого предлагается описывать конкретные визуальные параметры: цветовую температуру, тип света, плотность теней, погодные условия, текстуры поверхностей.

Редактирование изображений вместо полной генерации

Отдельный акцент сделан на редактировании уже существующих изображений. GPT-image-1.5 хорошо работает в сценариях, где нужно изменить только часть сцены, сохранив остальное без изменений. Например, поменять время суток, погоду или освещение, не затрагивая композицию, пропорции и расположение объектов.

В гайде подчёркивается важное правило: если что-то должно остаться неизменным, это нужно явно указать в промпте. Формулировки вроде «сохрани позу человека, геометрию сцены и расположение объектов» заметно снижают вероятность искажений.

Освещение и погода как управляемые параметры

Один из самых практичных разделов гайда посвящён трансформации освещения и погодных условий. OpenAI показывает, что модель способна работать с атмосферой изображения как с отдельным слоем:

  • смена дневного света на вечерний или ночной;
  • добавление дождя, снега, тумана;
  • управление направлением и мягкостью света;
  • изменение контраста без потери деталей.

При корректной формулировке GPT-image-1.5 сохраняет материалы, отражения и общий визуальный баланс сцены.

Меньше художественных метафор — больше технической точности

Гайд фактически продвигает инженерный подход к визуальным промптам. Технические описания («diffused light», «overcast sky», «low contrast shadows») работают заметно лучше, чем эмоциональные эпитеты. Это особенно важно для коммерческих задач, где требуется воспроизводимость результата, а не разовый удачный кадр.

GPT-image-1.5 Prompting Guide показывает, что генерация изображений выходит на новый уровень зрелости. Успех здесь зависит не от «креативного чутья», а от умения формулировать требования. Чем ближе промпт к техническому заданию, тем ближе результат к ожидаемому. Для бизнеса и продуктовых команд это означает одно: визуальный AI постепенно становится управляемым инструментом, а не источником случайных решений.

Если вам интересны практические разборы нейросетей, реальные кейсы применения AI — обратите внимание на Telegram-канал о нейросетях. Там регулярно разбирают новые модели, гайды и инструменты так, чтобы их можно было сразу применять в работе.

2
1
6 комментариев