LORA это мой первый опыт с Dreambooth-подобной тренировкой модели лично. Что бы она заработала так, как нужно, требуется достичь некоего барьера, который бы перезаписал знание токена, что требует от 6 до 13+ тысяч шагов, судя по треду, а так же судя по личным наблюдениям. Моя тренировка для стиля начала давать хоть какие-то результаты в нужном ключ…
Я заметил, что Лора хорошо работает на создании портретов, а если создавать изображение в человеческий рост, то лицо совсем другое. Что делать, подскажите пожалуйста?
Тут проблема скорее в размере, а не в самой лоре. Полноростовые генерации подразумевают то, что на лицо отводится меньшая часть картинки, что делает сложным аутентичное воссоздание лица, так как оно просто не находит детали, за которые можно зацепиться.
Либо увеличиваем размер(генерации и/или тренировки(до 640 например, в расширении Dreambooth от D8ahazard это приведёт почти к идеальному скейлингу до 768(в новой версии бакетинга), оставляя одну из сторон 512, что должно привести к лучшим результатам при создании 2:3/3:2 генераций которые можно использовать для полноростовых)), либо пытаемся добавлять максимально детальные полноростовые картинки в датасет, но это не обязательно поможет, так как разрешение тренировки низкое, и может оказаться так, что в даунскейльнутой версии деталей лица просто не будет, тогда и не натренируется ничего.
Да-да, знаю что своевременный ответ. Я по большей части забросил дтф, скучно стало. Если нужно будет что-то спросить, то я в дискорде дримбута D8, там на всё могу ответить.