Самая первая модель создавалась с нуля (неожиданно!): взяли кучу картинок, подрубили видяхи и натренировали. Для следующей модели - версии 1.2 - взяли первую модель и продолжили ее тренировать, в итоге получив новую. С остальными точно также: 1.3 это продолжение 1.2, 1.4 - продолжение 1.3, 1.5 - продолжение 1.4. Из этой линейки моделей, в силу качества получаемых картинок, лучше всего себя зарекомендовали версии 1.4 и 1.5. Сейчас, например, версия 1.5 это стандарт для тренировки разных дополнительных мелких моделей (экстрасетей типа лор, текстуальных инверсий, гиперсетей или создания своей модели). Также с версии 1.2 была выучена еще одна модель - 1.5 inpainting, предназначение которой (неожиданно! x2) inpaint и outpaint (перерисовка части картинки или дорисовка вне ее). Вот как выглядит линейка первой версии
1.5-inpainting вставить было некуда, но она естьOutpainting автор пользоваться не умеет, так и запишем
Но лучшая - 1.4, а в 2.0 были изменения не только датасета, но и частично архитектуры..
Да, я об этом упомянул вскользь, чтобы не скатываться сильно в технику
Без 100 грам не разобрать, что за воды настрочил, да ещё и 2 раза. На самом деле всё на столько просто, что даже сложно. Модель или контрольная точка - это мозги ИИ. Хочешь мозги анимешника, хочешь фотографа, а хочешь амбидекстера ну тот который в 2 полушария фигачит
Поставь тег #stablediffusion, чтобы не потерялось
Чтобы я без тебя делал, спасибо *чмок*
лучше всего себя зарекомендовали версии 1.4 и 1.5
— Нет (особенно 1.4 — по сути первая публичная версия с кучей багов). Просто 1.5 это более распространенный формат, потому что…
Обе линейки тренировались по разному (датасет, разрешение, количество шагов). Насколько я знаю, для второй линейки датасет фильтровали более консервативно: там получилось меньше nsfw, меньше качественных фото, меньше крутых артов и тд.
— Но нет. Не вводите людей в заблуждение — просто прочитайте, что происходило в момент релиза и чем завершилось. Кратко: в 2.0 по ошибке срезали слишком много, в 2.1 быстро все вырезанное вернули. Но в 2.x также поменяли модель обработки запросов и более корректно распределили ключевые слова (не стало такой сильной привязки к некоторым конкретным художникам и стилям, и вообще ключевые слова в запросах стали работать иначе). С 2.x двачеры, вопящие про вырезку nsfw из новой версии, работать не смогли — мозгов не хватило, видимо — поэтому больше моделей делают на базе 1.5. А еще это просто дешевле и быстрее.