GPT-5 на 58% приблизилась к разуму человека, согласно новому научному тесту на AGI
Группа ведущих мировых ученых в области AI (включая таких гигантов, как Йошуа Бенгио и Эрик Шмидт) опубликовала исследование, в котором впервые дала четкое и измеримое определение Общему Искусственному Интеллекту (AGI). И сразу же протестировала на нем последние модели OpenAI.
Что такое AGI по-научному?
AGI — это ИИ, который может выполнять когнитивные задачи на уровне или лучше образованного взрослого человека.
Как его измерили?
Чтобы это не осталось просто красивыми словами, ученые создали тест, основанный на самых проверенных моделях человеческого познания. Он оценивает AI по 10 ключевым критериям:
- Общие знания
- Чтение и письмо
- Математические способности
- Логическое мышление «на лету»
- Рабочая память
- Долговременная память (хранение и извлечение)
- Визуальное и аудиальное восприятие
- Скорость «мышления»
Результаты теста
Пока успели оценить только когнитивные способности моделей OpenAI, и результаты впечатляют:
- GPT-4 набрал 27% от уровня «образованного взрослого человека».
- GPT-5 показал результат уже в 58%.
Исследователи отмечают, что у моделей очень «рваный» профиль: они отлично справляются с задачами на знания, но все еще имеют серьезные проблемы с долговременной памятью.
Тем не менее, такой скачок от одной модели к другой показывает, насколько быстро развивается технология. Сами авторы, кажется, с иронией относятся к результатам, намекая, что начинать по-настоящему переживать о восстании машин стоит примерно после отметки в 75%.
P.S. Кстати, о таких новостях из мира AI я иногда пишу у себя в канале «Кнопка*».