Мне не нравится политика куртки по поводу памяти, вот они в конце чет показываю про скорость генерации картиночки на модели FLUX1.DEV, типа быстрее, но как же они прогревают на самом деле. Ладно, в целом можно оптимизировать использование тензеров на уже обученной модели, то есть для юзеров нейронок всё вполне прикольно, но про обучении, это не тол…
но про обучении, это не только ограничение на batchи, это бывает и ограничение на архитектуры...что там с обучением нейронок на amd? xD
Норм всё