Если вы планируете генерировать, используя ControlNet или же использовать hi-res fix, то используете параметр lowram. Это очень сильно снизит производительность, но даст максимально экономное использование видеопамяти. Если же вы не собираетесь использовать вышеописанные функции, можете попробовать использовать также medvram.
Оптимизируем и ускоряем Automatic1111, полный гайдПокупаем 4090.
Весь гайд :)
Окунулся мир тензорных вычислений, и теперь уменя от дух до трёх версий одинаковых пакетов , тtorch и , Cudadnn и тд. Из-за разных гуёв.
Спасибо за статью некоторых моментов не знал ...
Новый репозиторий - новая виртуальная среда - заново ставишь все пакеты.
Та же самая история, по идее можно заставить не использовать скрипты venv, а скормить то, что стоит в системе по умолчанию, но ведь кто-то что-то обязательно своей обновой сломает)
Negative Guidance minimum sigma выставляем значение 3. Сохраняем.Данный твик ускоряет генерацию за счет снижения значения cfg для негативного промта под конец генерации.
Вот это кстати нужно аккуратнее, например на чекпоинтах AOM качество итоговой картинки, яркость, контрастность оооочень сильно зависит от пачки стандартных для модели негативных промтов. На выходе с это настройкой получаем более блёклые цвета и где то то проёбанную контрастность местами. Короче разница видна прям невооруженным глазом. Стоит ли небольшое ускорение этого? Каждый решает сам, я вот не стал включать.
А что скажете на ситуацию, когда SD2.1 генерит карикатуры вместо реальных картинок по промпту? На SD 1.5 такой херни нет. Предполагаю, что это из-за того, что SD2.1 не умеет нормально понимать 512х512 генерацию?
Или там с кастомным диффузором шаманить надо?
Разве на новом Автоматике с torch2.0 нужно менять cudnn?
Статью писал с заделом на будущее. Но сейчас там стоят 8.7 из коробки, а актуальные - 8.9.