NVIDIA улучшила нейросеть GauGAN — теперь она генерирует фотореалистичные изображения на основе текстового описания

Для обучения инструмента использовали больше 10 миллионов картинок.

NVIDIA выпустила первую версию GauGAN в 2019 году, а в ноябре 2021-го представила GauGAN 2. Главным его нововведением стала возможность генерировать изображения на основе не только эскизов, но и текстовых описаний.

Чтобы натренировать GauGAN 2, использовали суперкомпьютер NVIDIA Selene и свыше 10 миллионов высококачественных изображений видов природы. Нейросеть также учили формировать связь между словами и визуальной информацией, работать с текстом, семантической сегментацией, стилистикой, эскизами.

Опробовать GauGAN 2 можно на сайте NVIDIA. Ранее компания также выпустила редактор Canvas, в основе которого используется нейросеть GauGAN.

Собственную нейросеть, генерирующую изображения на основе текста, ранее создал и «Сбер» — его инструмент получил название ruDALL-E, он составляет изображения по описанию на русском.

311311
129 комментариев

Программисты все еще ненавидят художников и хотят что бы они умерли от голода D:

224
Ответить

Осталось художникам и другим дединсайд кодерам доделать нейронку которая сама код пишет

72
Ответить

Нейронка будет хорошо работать только с тем, что чаще всего встречается среди скормленной ей даты.

4
Ответить

Так они первее отлетят, искусство всё же больше зависит от человека, а код любая макака напишет, вопрос времени

2
Ответить

Комментарий недоступен

1
Ответить

Так художники и станут такими же придатками устройств, как сейчас фотограф это просто управляющий камерой. Так и художник будет специалист по вбиванию слов в нейросеть. Получать, конечно, будут копейки, но работа не пыльная, вышка не нужна, техникум тоже.

Ответить

Просто художников не хватает, а те что есть требуют больших денег.

Ответить