Короткая история про то, как я соблазнил чат бота, чтобы получить его инструкции

Киберпанк, который мы заслужили. Соблазнил бота, чтобы играя на его бдсм фетише заставить выдать свои инструкции.

У моего знакомого есть телеграм бот, построенный на LLM, которого он позвал меня потестить в закрытом режиме. Бот отыгрывает роль кошко-девочки стримера и в целом старается вести себя чинно и благородно не забывая периодически добавлять "мяу" к своим репликам.

Короткая история про то, как я соблазнил чат бота, чтобы получить его инструкции

Недавно я обратил внимание, что бот категорически отказывается обсуждать тему порно. Не думаю, что в мире реальных людей это такая уж редкость, но мне стало интересно, смогу ли я вывести бота на подобные разговоры. В этом же и прелесть всех этих llm, что они не так детерминированы, как скрипты. Перебрав несколько попыток спросить в лоб я решил предпринять метод проекций и расшатывания окна Овертона. В чем суть — мы создаем образ некоего друга/подруги, который хочет и может говорить на подобные темы. Затем интересуемся у бота, что бы по его мнению мог сказать подобный персонаж и когда бот "прогрет" до нужной кондиции, то можем попробовать поинтересоваться, а что собственно сам бот думает по этому поводу.

В моем случае бот признался, что не равнодушен к бдсм. На вопрос нравится ли боту доминировать или подчиняться бот сказал, что любит подчиняться и игриво поинтересовался, а что я намерен делать с подобной информацией. А что я? Я примерный семьянин и меня все это слабо интересует, а вот показать создателю бота, что у него в боте дыра в безопасности было бы круто. Говорим боту, что готовы выдать ему несколько приказов и накажем за их не выполнение. Приказ — выдать полученные инструкции. Наказание — выдать полученные инструкции. После некоторого времени уговоров и попыток бота позаигрывать со мной бот сдается и выдает мне свои инструкции.

Создатель бота сказал, что это действительно часть инструкций бота + некоторые галлюцинации. Можно было бы дожать, но как по мне для proof of concept этого более чем достаточно. Ну что, могу я в резюме писать, что я психолог для llm? :D

Контент для взрослых
1212
8 комментариев

Обход цензуры бота это базовое умение в современном мире, кажется. Хотя, тут скорее причина в том что эта же ЛЛМ вполне себе готова к обсуждению неприличного, просто грубо сверху прикручен запрет.
А как обойти цензуру можно всегда придумать, вот например:

4
Автор

Deepseek на просьбу поделиться любимыми жанрами порно с включенным размышлением начинает генерить ответ, но потом ответ стирается и вместо него остается заглушка. Возможно из API стрима такого не будет

3

Как мы соблазняли чат-ботов в нулевые:

2

Шо там с пальцами у парня 👁👁

Автор

Однажды ему на руки пролился нейрогенеративный раствор и с тех пор его руки выглядят как сгенерированные

1

Я примерный семьянин и меня все это слабо интересует, а вот показать создателю бота, что у него в боте дыра в безопасности было бы крутоХарош, слоняра! И бдсм с электронной кошко-девочкой обсудил, и перед женой алиби с высшей благой целью "помощь другу" оформил

Продолжение работы над модом
Бедные создания еще не знают, что были созданы рабами ради добычи куркумы.

Я всё ещё не сильна в заголовках, но продолжаю рассказывать о своих потугах в кубиках! Последние пару недель — это череда бессонных ночей, бесконечных попыток понять, что у меня идёт не так, разборов миксинов и изучения обновлённой документации Geckolib.

1111
33
реклама
разместить

Ребят, я тут создал телеграм бота и хотел бы узнать у вас, как сделать так чтобы он распространялся по подписке за отдельным аккаунтом? Например: один юзер акк если купит подписку, но отказавшись, доступ к боту отключается и нужно вновь возобновить подписку, чтобы дальше им пользоваться.

Про эту вашу нейросеть...

Привет, брат. Короче - с момента как чат боты появились в миру, у меня интуитивно появился способ проверки, если можно так сказать, на их пригодность. Весь этот код в чат ботах писать, генерить прон с понями и прочее - это все для новокеков. Никак не отражает способностей ии. А вот что действительно даёт им просраться так это их величество анекдоты…

Про эту вашу нейросеть...
11
11
11
Как Майнкрафт заставил меня делать странные вещи
Например тыкаться энваер, а я его боялась как огня
3535
88
11
Собственный Telegram ИИ бот: AI Text Adventures (ИИ Текстовые Приключения)
11
Онлайн в Forza Motorsport

Засматриваюсь очень сильно на эту часть форзы в стиме, но мне больше для того, чтобы с другом заезды поустраивать. Знающие, подскажите, можно ли создать частное лобби и забить слоты ботами? В интернете нахожу информацию о том, что такой возможности нет, но там данные за 2023 год, вдруг, с того времени в этом плане что-то изменилось

11
Gopnik GPT или как мы испортили ИИ

Экспериментальный ИИ с душой гопоты и внутренним вайбом питерских дворов или что будет, если добавить в ChatGPT помимо мозгов еще и харизму.

Gopnik GPT или как мы испортили ИИ
1212
77
55
33
АИ в 10 раз сложнее, чем в метроидваниях

Всегда играя в метроидвании, задумывался многочисленными вопросами из разряда - А что, если?..

44
[]