Ней(де)генеративные сети делают х... фигню.
Просишь отредактировать изображение. Редактирует. Тебе не нравится. Просишь изменить ракурс. Ничего. Просишь убрать специфический объект с картинки. Она убирает другой. Затем тебе надо изменить пропорции. Бесполезно. Стиль. Меняет на всратый другой.
Генерирую изображение с нуля по текстовому запросу. Получается нейрослоп, который только умственно отсталый не увидит.
Эти выводы я пишу по Gemini и Qwen. Эти нейросети просто воплощение какого-то усреднения, с которого они ни шагу ногой.
Буквально каждый их ответ - это жри, что дают. Либо соглашаешься на одну из тысяч фундаментально одинаковых генераций, либо закрываешь чат с ней. Лио лезешь в фотошоп и пытаешься докрутить ключевые элементы сам.
В общем не знаю как для вас, но для меня нейронки, работающие с изображениями, оказались мертвой идеей. Эйфория прошла, и не осталось ничего. И если LLM можно дать 10/10, и они помогают со всеми текстовыми вопросами и задачами 24 на 7, то изображения получают 3/10 и используются как инструмент в виде последней надежды.