«Яндекс» показал прототип собственной нейросети для генерации картинок по текстовым запросам
Поддерживает русский и английский.
Запрос «Пудель ныряет в бассейн, как на обложке альбома Nevermind»
- Компания выпустила бета-версию 0.1.4 приложения «Шедеврум» для генерации изображений с помощью нейросети. Оно доступно на iOS и Android.
- Нейросеть понимает запросы на русском и английском языках, умеет подражать известным художникам, работать в разных художественных стилях. Чем подробнее описание, тем точнее будет результат, отметили в «Яндексе».
- После ввода текстового запроса, приложение предложит четыре варианта картинки на выбор, убедился редактор vc.ru. Понравившуюся можно сохранить и опубликовать в ленте. В последней также можно смотреть и лайкать результаты других пользователей, а также делиться ими. На отдельной ленте собраны популярные картинки.
Нейросеть формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, затем поэтапно увеличивает их разрешение и добавляет детали.
- Первую версию генеративной модели для бета-теста разработчики обучили на 240 млн примеров картинок с текстовыми описаниями. В компании отметили, что обучение продолжается на наборе данных из 500 млн примеров и в будущих версиях качество будет лучше.
- Первые пользователи автоматически получают доступ к генерации. С ростом их количества появится система заявок — новые пользователи смогут оставлять запросы после подтверждения заявки. В будущем такую возможность получат все зарегистрированные пользователи.
«Дама червей»
«Бобёр в стиле Энди Уорхола»
«Ночь, улица, фонарь, аптека»
«Уютный маленький дом на облаках»
«Маленький милый рыжий щеночек в стиле Клода Моне
«Лети, лети, лепесток»
Зашёл и сразу увидел это)
Комментарий недоступен
Автор запроса, кажется, с 9 вите иташки упал
Все еще нет.
Емнип, все эти нейронки (возможно, кроме MJ v5, которой улучшили понимание natural language) плоховато дружат с отрицаниями в запросах — они просто считают это очередными параметрами «что еще сделать».
А вообще даже у мж5 плохо с математикой) по запросу «три женщины и два мужчины» он рисует четверых людей х)
Надо было ещё раз 5 разными словами повторить запрос, чтобы уж наверняка
"дуэт вкуса и запаха" там тоже гениальный