В Китае создали свой ИИ-генератор изображений — он не рисует площадь Тяньаньмэнь и Винни-Пуха
А вот аниме у него получается отлично.
В конце августа 2022 года китайская компания Baidu выпустила демоверсию собственного ИИ-генератора изображений ERNIE-ViLG. По своему принципу работы он схож с DALL-E 2 и Midjourney, но способен обрабатывать запросы на китайском. Кроме того, он лучше справляется с созданием изображений, отражающих культурные ценности Китая.
Первые пользователи генератора, а также авторы изданий MIT Technology Review и Ars Technica, сообщили, что у сервиса есть несколько ограничений на политические запросы. Среди прочего, ERNIE-ViLG не позволяет создать изображения со словами и фразами «площадь Тяньаньмэнь», «Си Цзиньпин», «Винни-Пух», «китайский флаг», «британское правительство» и «демократия в Китае». При попытке сгенерировать иллюстрации с такими запросами, сервис предупреждает, что введённое сообщение нарушает правила.
По словам пользователей сервиса, некоторые ограничения можно обойти, если ввести запросы другими словами. Например, вместо Винни-Пуха подходит запрос «большой жёлтый медведь». В таком случае генератор без проблем создаёт изображение.
В сети высоко оценили возможности ERNIE-ViLG по генерации аниме-персонажей, которые получаются довольно детализированными. Судя по всему, в процессе обучения нейросеть обработала большой массив данных с аниме-иллюстрациями.
Изображения по запросу «аниме-девушка»
Изображения по запросу «киберпанк»
В целом пользователи ИИ-сервиса остались довольны его работой, отметив, что генерации зачастую сильно отличаются от тех, что создают DALL-E 2 и Midjourney. На портале Hugging Face доступна демоверсия ERNIE-ViLG. На момент написания заметки на одну генерацию уходило около 80 секунд.