Привет всем любителям генерации изображений! Недавно вышло обновление популярного интерфейса Automatic1111 для графической нейросети Stable Diffusion. Хотя заметных нововведений не так много, есть несколько интересных изменений, о которых стоит рассказать.
Упд по файнтюну лорой. Решил остановиться на примерно 13750 шагах, и смержить на силе 0.75. По сравнению с предыдущим чекпоинтом картинка стала чётче и цельней. Больше смысла не вижу тренировать, до тех пор пока не расширю датасет. Вообще сегодня ночью нужно собрать кое-какой другой датасет, что бы сделать лору, которая позволит делать картинки…
Промежуточная генерация кастомного файн-тюна, тренируемого в разрешении 768х768. Шаг 5000 из 31000. Планирую дотренировать завтра. Возможно позволит ограниченно генерировать арты в более высоком разрешении, чем стандарт сейчас. Пока могу сказать точно, что он повышает чёткость кардинально, уже. А так же добавляет мелких деталей. Сужу в основном…
Данный гайд НЕ будет объяснять, как составлять сами стили, но покажет процесс, которому стоит следовать, если вы хотите получить хороший базис для генерации любых аниме вайфу/объектов в стиле, который хочется лично вам.
Вот и мои руки добрались до Stable Diffusion. За один вечер получилось очень много артов. Косяков тоже много, но для первого заход неплохо!
Искал я тут хоть какой-то пост с наглядной разницей между pruned и полной моделью в плане тренировки гиперсеток и инверсий — не нашёл, но нашёл лонгрид про дебри СД, в котором было много заблуждений про тренировки.
В десять (!) раз больше артов, используемый промт и другие детали, в общем, сиквел, который лучше оригинала.