Называться модель будет DeepFloyd IF и это совершенно новая text-2-image модель. Не вдаваясь в технические подробности, теперь она сможет генерировать текст, а так же индекс похожести на текстовый запрос крайне высок. А так же лучше работает с реализмом. Что с руками, не уточняется). Больше примеров внутри поста.
забавно. Памяти требует тонну, а automatic1111 на картах AMD, где столько памяти есть, толком не работает. Ну, работает с производительностью 1-4 секунды на итерацию, что смешно по сравнению с SHARK, который раз в 10 быстрее.
Хуанговское лобби