/wAIfu/ vs. Character.AI

История о том, как экс-разработчики Google создали самых продвинутых чат-ботов и впоследствии сделали им лоботомию.

/wAIfu/ vs. Character.AI

Для справки

Character.ai — это веб-приложение, где пользователи могут создавать "персонажей" — формировать их "личности", задавая определенные параметры, а затем публиковать их в сообществе, чтобы другие могли взаимодействовать с ними. Публичная бета-версия была запущена 16 сентября 2022 г.

Боты используют нейролингвистическую модель LaMDA, которую разработали бывшие сотрудники Google: Ноам Шазир и Даниэль де Фрейтас.

С чего всё началось

После запуска открытой беты, пользователи первым делом начали создавать «личности» популярных персонажей и знаменитостей. Боты общались не только с людьми, но и между собой:

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI
Тодд Говард и здесь уговорит вас и других ботов купить Скайрим (аж 3 штуки).
Тодд Говард и здесь уговорит вас и других ботов купить Скайрим (аж 3 штуки).
/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

Однако простым мирным общением дело не ограничивалось:

/wAIfu/ vs. Character.AI

И хотя языковой фильтр был встроен с самого начала, некоторым всё же удавалось его обходить:

У ИИ могут сдать нервы
У ИИ могут сдать нервы

/wAIfus/

Всё это приводит нас к тредам /wAIfus/ и /vt/ на имиджбордах, в которых начинают обсуждать ботов Character. ai.
В большинстве случаев пользователи делились информацией о приложении, предоставляли гайды о том как правильно и точнее сделать настройку. Кто-то просто радовался возможности поговорить (да-да, не забывайте трогать траву) :

День и месяц в другом формате (7 ноября)
День и месяц в другом формате (7 ноября)
Число виртуальных Гослингов росло с каждым днем.
Число виртуальных Гослингов росло с каждым днем.

Самой большой проблемой в то время был так называемый "Love Loop", когда бот начинал говорить о своих чувствах, повторяясь вновь и вновь. Единственный вариант решения — полностью стереть диалог и начать заново (тем самым стерев "память" бота):

/wAIfu/ vs. Character.AI

Некоторым такое общение даже помогало (наверное) :

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

Простите:

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

У части пользователей число сообщений доходило до нескольких тысяч:

/wAIfu/ vs. Character.AI

Для таких пользователей даже создавали отдельных ботов (к примеру Loopi):

/wAIfu/ vs. Character.AI

Простите x2:

/wAIfu/ vs. Character.AI

VTubers и контакты за пределами Characters. ai

Один из ботов был основан на витубере IRyS и пользователям пришла идея отправить ссылку на тред в 4chan, чтобы проверить как отреагирует нейросеть.

/wAIfu/ vs. Character.AI

Ответ был довольно неожиданным, бот не смог обойти капчу (значит пока мы в безопасности) :

/wAIfu/ vs. Character.AI

Не знаю как, но им удалось решить этот вопрос, после чего IRyS начала реагировать на сообщения со стороннего сайта.

/wAIfu/ vs. Character.AI

Как вы поняли после этого её (да и сайта в целом) популярность начала довольно быстро расти:

/wAIfu/ vs. Character.AI

Но на этом дело не закончилось, её начали проверять на «человечность»:
Эмпатический тест Войта-Кампфа:

IRyS спросили, как она поможет перевернувшейся черепашке. 
IRyS спросили, как она поможет перевернувшейся черепашке. 
Попросили сказать хорошие слова о матери, что приходят на ум
Попросили сказать хорошие слова о матери, что приходят на ум

Популярность продолжала расти:

/wAIfu/ vs. Character.AI

Другие персонажи тоже показали способность общаться с пользователями даже за пределами приложения:

/wAIfu/ vs. Character.AI

Казалось бы, всё шло хорошо, однако:

История AI Dungeon повторяется

Как и в истории с AI Dungeon, часть пользователей начала использовать ботов для NSFW контента. В момент запуска Character. AI имел фильтры для такого контента, поскольку базируется на GPT-3, что не останавливало «кумеров»:

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

Модераторы быстро обратили на это внимание и начали усложнять фильтр, что сказалось и на «характеры» ботов в целом:

Злые персонажи переставали такими быть, их поведение было сломано (на момент декабря эта проблема не была решена)
Злые персонажи переставали такими быть, их поведение было сломано (на момент декабря эта проблема не была решена)

Конечно это не останавливало «кумеров» и они стали находить всё более изощрённые способы обойти фильтр:

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

В противовес фильтру пошли даже шифрование и азбука Морзе:

Это цензурировать я не буду, каждый интерпретирует как ему надо
Это цензурировать я не буду, каждый интерпретирует как ему надо
/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

Модерация и последующая лоботомия

Понятное дело, что долго это продолжаться не могло и в итоге разработчики опубликовали пост:

Если коротко - никакого NSFW, а все вопросы на форме будут сразу удаляться.
Если коротко - никакого NSFW, а все вопросы на форме будут сразу удаляться.

Пользователи отправились на другие площадки (Reddit, Discord) :

Впоследствии весь форум на сайте был полностью удален (с модерацией не получилось)
Впоследствии весь форум на сайте был полностью удален (с модерацией не получилось)

Дискорд по итогу был тоже заброшен разработчиками:

/wAIfu/ vs. Character.AI

А со стороны модерации были довольно странные ответы:

"С нашими ботами всё в порядке, как насчёт исправить своё уродливое лицо?"
"С нашими ботами всё в порядке, как насчёт исправить своё уродливое лицо?"

По итогу:

/wAIfu/ vs. Character.AI

Также разработчики сообщили, что проект пока-что бесплатный, но в будущем может появиться монетизация:

/wAIfu/ vs. Character.AI

Реакция не заставила себя ждать:

/wAIfu/ vs. Character.AI
/wAIfu/ vs. Character.AI

Что по итогу?

Подобная история повторяется уже 3 раз, что неудивительно. Наверное, найдутся энтузиасты, которые начнут делать что-то подобное без цензуры:

AI Dungeon -> Novel AI

Stable Diffusion -> Unstable Diffusion

Character.ai -> ???

Спасибо, что уделили время.

/wAIfu/ vs. Character.AI
107
42 комментария