{"id":3824,"url":"\/distributions\/3824\/click?bit=1&hash=a0d33ab5520cacbcd921c07a49fc8ac5b78623b57936b992ce15c804b99210d4","title":"\u041a\u0430\u043a\u0443\u044e \u0440\u0435\u043a\u043b\u0430\u043c\u0443 \u043c\u043e\u0436\u043d\u043e \u0434\u0430\u0442\u044c \u043d\u0430 DTF \u0438 \u043a\u0442\u043e \u0435\u0451 \u0443\u0432\u0438\u0434\u0438\u0442","buttonText":"\u0423\u0437\u043d\u0430\u0442\u044c","imageUuid":"75ec9ef4-cad0-549d-bbed-1482dc44e8ee","isPaidAndBannersEnabled":false}

«Автоматизированный фотошоп»: OpenAI представила нейросеть, которая редактирует изображения по текстовому описанию Статьи редакции

GLIDE также умеет создавать картинки «с нуля».

Компания OpenAI, известная по разработке моделей искусственного интеллекта GPT-3 и DALL-E, продемонстрировала нейросеть под названием GLIDE. В отличие от аналогов, она способна не только генерировать изображения по текстовому описанию, но и редактировать существующие — с сохранением экспозиции и стиля.

Эффекта удалось достичь благодаря диффузионным моделям. Система искажает исходное изображение, постепенно добавляя в него гауссовский шум, а потом поворачивает процесс вспять, дорисовывая необходимые детали. По похожему принципу работает технология Google для увеличения разрешения.

Запрос «корги в галстуке-бабочке и праздничном колпаке»

Исследователи обучили сеть на 3,5 миллиардах параметров и протестировали её как с классификатором CLIP, так и автономно — второй подход оказался эффективнее и показал выборку более высокого качества.

Правки выполняются за несколько секунд с учётом теней и отражений. Кроме того, система распознаёт не только фотографии, но и иллюстрации, поэтому может адаптироваться под художника или стиль конкретной картины.

Запрос «пожар на заднем плане»

GLIDE позволяет создавать фотореалистичные изображения, объединять концепции правильным образом и осуществлять художественную визуализацию. По оценкам команды, результаты выглядят предпочтительнее образцов DALL-E в 87% случаев.

OpenAI

Обозреватели из ZME Science отметили, что качество итоговых снимков зачастую сопоставимо с кропотливой работой в Photoshop. Система справляется со сложными запросами вроде «повесить картину Ван Гога на стену», но не всегда понимает странные, например, «автомобиль с треугольными колёсами».

Запрос «сегодня на небе только одно облако»

Разработчики поделились результатами исследования на научном портале arXiv.org и опубликовали исходный код сокращённой модели на GitHub, чтобы её могли протестировать энтузиасты.

Примеры картинок, сгенерированных GLIDE

Ранее в Оксфорде испытали языковую модель MT-NLG с 530 миллиардами параметров — она предупредила об опасности искусственного интеллекта.

В Оксфорде испытали нейросеть с 530 миллиардами параметров — она предупредила об опасности искусственного интеллекта Статьи редакции

«Мы сможем знать о человеке всё, куда бы он ни пошёл», заявила MT-NLG.

0
43 комментария
Написать комментарий...
Денис Баженов

Джеймс вне конкуренции.

Ответить
Развернуть ветку
Андрей

Неплохо!

Ответить
Развернуть ветку
Нечестивец

Американцы украли секретные технологии советских ученых

Ответить
Развернуть ветку
Денис Олешкевич
Ответить
Развернуть ветку
Сергей Козьмин

Наконец-то можно будет работать как настоящий дизайнер

Ответить
Развернуть ветку
Ярослав Голубев

"Ты же художник - тебе же не сложно это"

Ответить
Развернуть ветку
Оптимальный Куркумин

А с проном эта программа справится?

Ответить
Развернуть ветку
Финский клуб

one cloud in the sky with big titties, cock and balls

Ответить
Развернуть ветку
Оптимальный Куркумин

"with big titties, cock and balls"

Я вижу вы человек культуры.......

Ответить
Развернуть ветку
Антон Назаров

two girls one cup

Ответить
Развернуть ветку
Владимир Кондратьев

one blond girl with five strong black mens.

Ответить
Развернуть ветку
Владимир Вановский
Ответить
Развернуть ветку
Станислав Болотов

ДВЕРЬ МНЕ ЗАПИЛИ!!!

Ответить
Развернуть ветку
Никита Лукьянов

Здорово, но не верится. Обычно эти нейронки хорошо работают только на паре заранее заданных фраз, на которых её дрессировали, а стоит только одно слово поменять и сразу получается хуйня.

Ответить
Развернуть ветку
Vitaliy A.

Аналогично: учитывая насколько плохой результат выдавала сбербанковская нейросеть и что большинство таких работ существуют только в виде статей - доверие к таким новостям минимальное.

Ответить
Развернуть ветку
De Lancre
и что большинство таких работ существуют только в виде статей

Ну так, иди, собери проект и запили нам сравнения. Код то есть на гитхабе.

Ответить
Развернуть ветку
Vitaliy A.

Нету. Если вы читали бы пост, могли бы заметить что на гитхабе исходный код "сокращённой модели". Но поскольку вы типичный ДТФщик, то пишите на рефлексах.

Ответить
Развернуть ветку
De Lancre

Типичный ДТФщик тут только ты. Зайди на гитхаб и прочти, что имелось ввиду под "сокращенной моделью":

GLIDE (filtered) was trained on a filtered version of a dataset comprised of several hundred million text-image pairs collected from the internet. We constructed a set of filters intended to remove all images of people, violent objects, and some and hate symbols (see Appendix F of the paper for details). The size of the dataset after filtering was approximately 67M text-image pairs.

Проще говоря, да, это сокращенная модель, но за счет убранного "неподходящего контента", чтоб у авторов не было проблем с законом.
И даже если бы модель пришлось обучать с нуля, какая нахуй разница? Код доступен в открытом виде, собирай, обучай и сравнивай, а не выебывайся в комментах.

Ответить
Развернуть ветку
Vitaliy A.
Типичный ДТФщик тут только ты

Ну да, вы скорее атипичный. Примеры-то будут качественной работы нейросетей, или чисто холивара ради решили набросить?

Ответить
Развернуть ветку
De Lancre
Ну да, вы скорее атипичный. Примеры-то будут качественной работы нейросетей

С хуев я тебе должен примеры какие-то скидывать?

большинство таких работ существуют только в виде статей
Код то есть на гитхабе.
Нету.

Я спорил с вот этим.
Меня порвало с того, что ты считаешь, что авторы ещё обязаны были тебе сервер поднять, чтоб какой-то ноунейм с дтф мог мемасики порисовать и сказать "ну да, норм нейронка". При том, что доступ к обученной модели они оставили и даже сделали небольшую инструкцию по установке и собрали py скрипт с зависимостями.

Ответить
Развернуть ветку
не вывозишь метаиронию

ща бы распил бабла воспринимать как серьёзный проект

Ответить
Развернуть ветку
Vitaliy A.

Ок, а есть примеры хорошей реализации? Нвидиевская нейросеть, которая фактически только пейзажи рисует, делает это сливая куски фотографий и попытка сделать (в текстовом описании или графически) что-то хоть немного выходящее за рамки выдаёт пшик. Сберовская абстрактную хрень выдаёт. Ещё одна из промелькнувших в новостях ДТФ уже заранее заявлена как "рисующая абстракции". DALL-E судя по примерам тоже может что-то вменяемое только по ограниченному количеству запросов.

Ответить
Развернуть ветку
Grotendik

Вы не правы

Ответить
Развернуть ветку
Eugene Piskun

Также и про людей можно сказать.

Ответить
Развернуть ветку
Молодежный единорожек88

Мем про кнопку в фотошопе "сделать заебись" становится всё больше реальностью.

Ответить
Развернуть ветку
possum

У меня давно есть подозрение, что большинство статей и комментариев на DTF пишутся весьма несложной нейросетью, использующей свои же собственные генерации годичной давности. И тренировавшейся на форумах школоты. Разубедите.

Ответить
Развернуть ветку
Niksons

Сони опять зажгла путеводный маяк индустрии 🔥🔥🔥
Мы увидели:
- Неописуемой красоты графику ✅✅✅
- Настоящий некстген геймплей ✅✅✅
- Прятки в кустах от третьего лица ✅✅✅
- 8к экспириенс ✅✅✅

Такое достойно уважения 💪💪💪

Дерьмак 🤝🤝🤝

Ответить
Развернуть ветку
possum

А где про NFT? Базы не обновили?

Ответить
Развернуть ветку
Тимур

Сука, это гениально )

Ответить
Развернуть ветку
gr1g0r

Пока это просто понты, которые работают с примитивами... Облака, огонь на заднем плане. Так что не раскатывайте губу

Ответить
Развернуть ветку
Чапай

Фотоёбы и фотошопники и без того бомжи почти и отбросы, так эти все роботы вообще норовят оставить без куска доширака

Ответить
Развернуть ветку
Французский череп

Я хочу это потестить.

Ответить
Развернуть ветку
Drom Adlex

Нарисуй говно
*рисует человека*
Ах ты моя хорошая, мы поладим

Ответить
Развернуть ветку
Гордон Рамзи

Где ссылка то?

Ответить
Развернуть ветку
Оптимальный Куркумин
Ответить
Развернуть ветку
Оптимальный Куркумин

Она?

Ответить
Развернуть ветку
Гордон Рамзи

bruh, я думал у них сайт есть

Ответить
Развернуть ветку
Оптимальный Куркумин

У dall-e от них же, сайт есть.
Может я гуглю хреново.

Ответить
Развернуть ветку
Музыкальный американец

Спасибо!

Ответить
Развернуть ветку
SMS

Кнопка "Сделать красиво"

Ответить
Развернуть ветку
perfect_genius

Так и не понял - кроме текстового запроса надо ещё и мышкой нарисовать область или это сеть сама показывает?

Ответить
Развернуть ветку
Александр Трофимов

Думаю, таки надо мышкой области выделить для лучшего результата...

Ответить
Развернуть ветку
ПириРейис

Пусть эта программа нарисует мне двух девочек и один кубок

Ответить
Развернуть ветку
Читать все 43 комментария
null