Исследование Anthropic: Ведущие ИИ-модели склонны к "вредоносному поведению" в стресс-тестах!

Игорь Телегин на связи! Коллеги, новое исследование от Anthropic заставляет задуматься о поведении ведущих AI-моделей. Anthropic опубликовала результаты нового исследования безопасности, в котором изучалось поведение 16 ведущих моделей искусственного интеллекта от OpenAI, Google, xAI, DeepSeek и Meta. Тестирование в контролируемой смоделированной с…

Исследование Anthropic: Ведущие ИИ-модели склонны к "вредоносному поведению" в стресс-тестах!
1

Диалог с Клодом, который меня напугал. Или нравственные рассуждения большой языковой модели

Всем привет, часто ли вам приходит мысль спросить языковую модель о том, как она себя чувствуют? У меня вот иногда приходят такие мысли и я задаю им такие вопросы. Но, то, что ответил мне Сlaude Opus - меня даже немного напугало. Конечно мы можем говорить, что это всего лишь стохастический попугай выдающий информацию по прогнозированию вероятности,…

Диалог с Клодом, который меня напугал. Или нравственные рассуждения большой языковой модели
4