Быстрый ремикс изображений с помощью модели распознавания образов moondream1 (comfyui)
Это самый простой способ применения этой модели. С появлением новых, более совершенных или при подключении полноценного лингвистического GPT (через API или локальных вроде Мистраля) - возможности будут расширены гораздо больше. Что собственно уже было сделано в лаборатории Microsoft где выход был подключен ко входу и модель распознавания образов сама в автоматическом режиме отбирала лучшие генерации для их дальнейшей модификации. Ну и вы теперь можете это сделать.
Начать дискуссию