Пользуемся зрением Bing AI для написания качественного промта для SDXL по референсному изображению

Не у всех есть деньги (а главное возможность использования без местных заморочек) на Chat GPT с "глазами". Но как, как это обычно и бывает у нас есть альтернативы. В принципе все то-же самое что и с Chat GPT вы можете делать к примеру в чате Bing от майкрософт. У которого зрение "бесплатное".

Допустим мы хотим получить что-то на подобии этой картинки (сгенерированной по прому от майкрософт Азуре)

Пользуемся зрением Bing AI для написания качественного промта для SDXL по референсному изображению

Вставляем картинку в Бинг и просим сделать промт для генерации чего-то подобного

Prompt: Create an image in a photo realistic style that shows a group of people and a buffalo sitting at a table in a bar. The buffalo should be the center of attention and have large horns and brown fur. The people should be of different races and genders and have different hairstyles and clothes. On the table, there should be beer and chicken wings. In the background, there should be a window with a view of a house and trees, as well as some frames with pictures on the wall.

Результат в SDXL уже получается довольно неплохой. За одним изключением - буйвол у нас выходит не антропоморфный

Все-таки SDXL это не Чат Гпт и что такое "антропоморфный" он по всей видимости не понимает. Так что просто исправляем buffalo на "buffalo-man"

Ну, уже неплохо. Правда Минотавр у нас какой-то угрюмый. Попробуем его развеселить поменяв выражение лица через промт (добавив в него "глупое лицо")

Результат неплохой, при условии что вы хотите видеть за столом именно Буйвола. Реального буйвола с его реальной анатомией (головы)

Однако можно пойти еще дальше и воспользоваться IP адаптером с вот таким выражениеи лица:

Ну и тд. При желании зайти можно довольно далеко...