GPT-5 на 58% приблизилась к разуму человека, согласно новому научному тесту на AGI

Группа ведущих мировых ученых в области AI (включая таких гигантов, как Йошуа Бенгио и Эрик Шмидт) опубликовала исследование, в котором впервые дала четкое и измеримое определение Общему Искусственному Интеллекту (AGI). И сразу же протестировала на нем последние модели OpenAI.

AGI — это ИИ, который может выполнять когнитивные задачи на уровне или лучше образованного взрослого человека.

Чтобы это не осталось просто красивыми словами, ученые создали тест, основанный на самых проверенных моделях человеческого познания. Он оценивает AI по 10 ключевым критериям:

Общие знания
Чтение и письмо
Математические способности
Логическое мышление «на лету»
Рабочая память
Долговременная память (хранение и извлечение)
Визуальное и аудиальное восприятие
Скорость «мышления»

Пока успели оценить только когнитивные способности моделей OpenAI, и результаты впечатляют:

GPT-4 набрал 27% от уровня «образованного взрослого человека».
GPT-5 показал результат уже в 58%.

Исследователи отмечают, что у моделей очень «рваный» профиль: они отлично справляются с задачами на знания, но все еще имеют серьезные проблемы с долговременной памятью.

Тем не менее, такой скачок от одной модели к другой показывает, насколько быстро развивается технология. Сами авторы, кажется, с иронией относятся к результатам, намекая, что начинать по-настоящему переживать о восстании машин стоит примерно после отметки в 75%.

P.S. Кстати, о таких новостях из мира AI я иногда пишу у себя в канале «Кнопка*».

t.me

Кнопка*

GPT-5 на 58% приблизилась к разуму человека, согласно новому научному тесту на AGI

Что такое AGI по-научному?

Как его измерили?

Результаты теста