«Автоматизированный фотошоп»: OpenAI представила нейросеть, которая редактирует изображения по текстовому описанию Статьи редакции
GLIDE также умеет создавать картинки «с нуля».
Компания OpenAI, известная по разработке моделей искусственного интеллекта GPT-3 и DALL-E, продемонстрировала нейросеть под названием GLIDE. В отличие от аналогов, она способна не только генерировать изображения по текстовому описанию, но и редактировать существующие — с сохранением экспозиции и стиля.
Эффекта удалось достичь благодаря диффузионным моделям. Система искажает исходное изображение, постепенно добавляя в него гауссовский шум, а потом поворачивает процесс вспять, дорисовывая необходимые детали. По похожему принципу работает технология Google для увеличения разрешения.
Исследователи обучили сеть на 3,5 миллиардах параметров и протестировали её как с классификатором CLIP, так и автономно — второй подход оказался эффективнее и показал выборку более высокого качества.
Правки выполняются за несколько секунд с учётом теней и отражений. Кроме того, система распознаёт не только фотографии, но и иллюстрации, поэтому может адаптироваться под художника или стиль конкретной картины.
GLIDE позволяет создавать фотореалистичные изображения, объединять концепции правильным образом и осуществлять художественную визуализацию. По оценкам команды, результаты выглядят предпочтительнее образцов DALL-E в 87% случаев.
Обозреватели из ZME Science отметили, что качество итоговых снимков зачастую сопоставимо с кропотливой работой в Photoshop. Система справляется со сложными запросами вроде «повесить картину Ван Гога на стену», но не всегда понимает странные, например, «автомобиль с треугольными колёсами».
Разработчики поделились результатами исследования на научном портале arXiv.org и опубликовали исходный код сокращённой модели на GitHub, чтобы её могли протестировать энтузиасты.
Ранее в Оксфорде испытали языковую модель MT-NLG с 530 миллиардами параметров — она предупредила об опасности искусственного интеллекта.
Джеймс вне конкуренции.
Неплохо!
Американцы украли секретные технологии советских ученых
Наконец-то можно будет работать как настоящий дизайнер
"Ты же художник - тебе же не сложно это"
А с проном эта программа справится?
one cloud in the sky with big titties, cock and balls
"with big titties, cock and balls"
Я вижу вы человек культуры.......
two girls one cup
one blond girl with five strong black mens.
ДВЕРЬ МНЕ ЗАПИЛИ!!!
Здорово, но не верится. Обычно эти нейронки хорошо работают только на паре заранее заданных фраз, на которых её дрессировали, а стоит только одно слово поменять и сразу получается хуйня.
Аналогично: учитывая насколько плохой результат выдавала сбербанковская нейросеть и что большинство таких работ существуют только в виде статей - доверие к таким новостям минимальное.
Ну так, иди, собери проект и запили нам сравнения. Код то есть на гитхабе.
Нету. Если вы читали бы пост, могли бы заметить что на гитхабе исходный код "сокращённой модели". Но поскольку вы типичный ДТФщик, то пишите на рефлексах.
Типичный ДТФщик тут только ты. Зайди на гитхаб и прочти, что имелось ввиду под "сокращенной моделью":
GLIDE (filtered) was trained on a filtered version of a dataset comprised of several hundred million text-image pairs collected from the internet. We constructed a set of filters intended to remove all images of people, violent objects, and some and hate symbols (see Appendix F of the paper for details). The size of the dataset after filtering was approximately 67M text-image pairs.Проще говоря, да, это сокращенная модель, но за счет убранного "неподходящего контента", чтоб у авторов не было проблем с законом.
И даже если бы модель пришлось обучать с нуля, какая нахуй разница? Код доступен в открытом виде, собирай, обучай и сравнивай, а не выебывайся в комментах.
Ну да, вы скорее атипичный. Примеры-то будут качественной работы нейросетей, или чисто холивара ради решили набросить?
С хуев я тебе должен примеры какие-то скидывать?
большинство таких работ существуют только в виде статейКод то есть на гитхабе.
Нету.
Я спорил с вот этим.
Меня порвало с того, что ты считаешь, что авторы ещё обязаны были тебе сервер поднять, чтоб какой-то ноунейм с дтф мог мемасики порисовать и сказать "ну да, норм нейронка". При том, что доступ к обученной модели они оставили и даже сделали небольшую инструкцию по установке и собрали py скрипт с зависимостями.
ща бы распил бабла воспринимать как серьёзный проект
Ок, а есть примеры хорошей реализации? Нвидиевская нейросеть, которая фактически только пейзажи рисует, делает это сливая куски фотографий и попытка сделать (в текстовом описании или графически) что-то хоть немного выходящее за рамки выдаёт пшик. Сберовская абстрактную хрень выдаёт. Ещё одна из промелькнувших в новостях ДТФ уже заранее заявлена как "рисующая абстракции". DALL-E судя по примерам тоже может что-то вменяемое только по ограниченному количеству запросов.
Вы не правы
Также и про людей можно сказать.
Мем про кнопку в фотошопе "сделать заебись" становится всё больше реальностью.
У меня давно есть подозрение, что большинство статей и комментариев на DTF пишутся весьма несложной нейросетью, использующей свои же собственные генерации годичной давности. И тренировавшейся на форумах школоты. Разубедите.
Сони опять зажгла путеводный маяк индустрии 🔥🔥🔥
Мы увидели:
- Неописуемой красоты графику ✅✅✅
- Настоящий некстген геймплей ✅✅✅
- Прятки в кустах от третьего лица ✅✅✅
- 8к экспириенс ✅✅✅
Такое достойно уважения 💪💪💪
Дерьмак 🤝🤝🤝
А где про NFT? Базы не обновили?
Сука, это гениально )
Пока это просто понты, которые работают с примитивами... Облака, огонь на заднем плане. Так что не раскатывайте губу
Фотоёбы и фотошопники и без того бомжи почти и отбросы, так эти все роботы вообще норовят оставить без куска доширака
Я хочу это потестить.
Нарисуй говно
*рисует человека*
Ах ты моя хорошая, мы поладим
Где ссылка то?
https://github.com/openai/glide-text2im
Она?
bruh, я думал у них сайт есть
У dall-e от них же, сайт есть.
Может я гуглю хреново.
Спасибо!
Кнопка "Сделать красиво"
Так и не понял - кроме текстового запроса надо ещё и мышкой нарисовать область или это сеть сама показывает?
Думаю, таки надо мышкой области выделить для лучшего результата...
Пусть эта программа нарисует мне двух девочек и один кубок