Обзор нового GPT-image-1.5. Лица теперь очень точны. Как правильно генерить изображения, промты от разрабов.
С выходом GPT-image-1.5 стало понятно, что генерация изображений постепенно уходит к предсказуемому процессу. Вместе с моделью OpenAI опубликовала подробный Prompting Guide, который фактически задаёт правила работы с визуальными запросами: как формулировать инструкции, чего ожидать от модели.
Этот гайд интересен не только дизайнерам, но и разработчикам, которые используют генерацию изображений в продуктах, маркетинге или автоматизированных пайплайнах.
Ключевая идея гайда: модель следует инструкции, а не «догадывается»
OpenAI прямо рекомендует избегать абстрактных формулировок вроде «сделай красивее» или «добавь стиль». Вместо этого предлагается описывать конкретные визуальные параметры: цветовую температуру, тип света, плотность теней, погодные условия, текстуры поверхностей.
Редактирование изображений вместо полной генерации
Отдельный акцент сделан на редактировании уже существующих изображений. GPT-image-1.5 хорошо работает в сценариях, где нужно изменить только часть сцены, сохранив остальное без изменений. Например, поменять время суток, погоду или освещение, не затрагивая композицию, пропорции и расположение объектов.
В гайде подчёркивается важное правило: если что-то должно остаться неизменным, это нужно явно указать в промпте. Формулировки вроде «сохрани позу человека, геометрию сцены и расположение объектов» заметно снижают вероятность искажений.
Освещение и погода как управляемые параметры
Один из самых практичных разделов гайда посвящён трансформации освещения и погодных условий. OpenAI показывает, что модель способна работать с атмосферой изображения как с отдельным слоем:
- смена дневного света на вечерний или ночной;
- добавление дождя, снега, тумана;
- управление направлением и мягкостью света;
- изменение контраста без потери деталей.
При корректной формулировке GPT-image-1.5 сохраняет материалы, отражения и общий визуальный баланс сцены.
Меньше художественных метафор — больше технической точности
Гайд фактически продвигает инженерный подход к визуальным промптам. Технические описания («diffused light», «overcast sky», «low contrast shadows») работают заметно лучше, чем эмоциональные эпитеты. Это особенно важно для коммерческих задач, где требуется воспроизводимость результата, а не разовый удачный кадр.
GPT-image-1.5 Prompting Guide показывает, что генерация изображений выходит на новый уровень зрелости. Успех здесь зависит не от «креативного чутья», а от умения формулировать требования. Чем ближе промпт к техническому заданию, тем ближе результат к ожидаемому. Для бизнеса и продуктовых команд это означает одно: визуальный AI постепенно становится управляемым инструментом, а не источником случайных решений.
Если вам интересны практические разборы нейросетей, реальные кейсы применения AI — обратите внимание на Telegram-канал о нейросетях. Там регулярно разбирают новые модели, гайды и инструменты так, чтобы их можно было сразу применять в работе.