Grok 4.1 — самая умная нейросеть на планете? Вот вам факты и цифры

На днях компания xAI представила новую модель Grok 4.1. Она демонстрирует феноменальные показатели, особенно это касается областей взаимодействия человека и ИИ.

Grok 4.1 — самая умная нейросеть на планете? Вот вам факты и цифры

По данным пресс-релизов компании, высокий результат получился благодаря применению усовершенствованной инфраструктуры обучения с подкреплением (RLHF).

Цифры и факты, которые говорят сами за себя:

Модель Grok 4.1 уверенно занимает лидирующие позиции в ряде независимых бенчмарков:

· Лидерство в бенчмарках (LMArena): В режиме "мышления" (Thinking Mode) Grok 4.1 занимает первое место в независимом публичном рейтинге LMArena Text Arena Leaderboard, опережая даже Claude Opus 4.1 и GPT-5.

· Снижение галлюцинаций: xAI заявляет о снижении количества фактических ошибок (галлюцинаций) в 3 раза по сравнению с предыдущими версиями, что делает ответы намного надежнее.

· Эмоциональный интеллект (EQ): Модель получила рекордный балл 1583 в бенчмарке EQ-Bench3, демонстрируя выдающееся понимание эмоциональных нюансов и способность к эмпатичному общению.

· Креативное письмо: Grok 4.1 показал результаты, сравнимые с лучшими мировыми моделями, на бенчмарке Creative Writing v3.

В чем Grok 4.1 лучше других нейросетей?

1. Уникальный режим "Мышления". Модель может работать в двух режимах: быстром (Non-Thinking) для мгновенных ответов и режиме рассуждения (Thinking), который проводит глубокий внутренний анализ запроса перед ответом. Это обеспечивает как скорость, так и глубину проработки сложных задач.

2. Реальная мультиканальность (Multimodality). Grok 4.1 не просто работает с текстом, но и понимает изображения, а также имеет высококачественный голосовой режим, способный анализировать происходящее через камеру пользователя в реальном времени.

3. Скорость и доступность. Пользователи в слепых тестах предпочитали Grok 4.1 предыдущей версии в 64,78% случаев, отмечая лучшую скорость и качество ответов.

Grok 4.1 — это серьезный конкурент для OpenAI и Anthropic, предлагающий превосходное сочетание интеллекта, скорости и эмоционального понимания, а теперь еще и доступный широкой аудитории.

5
2
11 комментариев