«Сбер» создал нейросеть ruDALL-E — она генерирует изображения по описанию на русском языке

Прежде такие алгоритмы поддерживали только английский.

Хасан Кахраман, звёздный котик и сексуальная Натали Портман по версии нейросети
504504

В целом результаты получаются хуже чем у оригинального сервиса, что печалит.

Ответить

Демка основана на модели с 1,3 млрд параметров и выбирается один вариант из одного. В оригинале генерируется 512 картинок моделью с 12 млрд параметров, а потом при помощи CLIP выбираются наилучшие. Такую демку мы, к сожалению, бесплатно не можем раскатать. Сейчас у нас 200 V100 обслуживают поток желающих погенерировать картинки, и то ожидание по 20+ минут. Если бы мы раскатали на демо большую модель + 512 картинок сразу + ранжирование ruCLUP, то умножайте на 5120 примерно, а у нас столько железок нет :)

9
Ответить

Как называется оригинальный сервис, не подскажешь?

Ответить