OpenAI представила gpt-oss — рассуждающие модели с открытыми весами
Они доступны на Hugging Face.
- Представлено два варианта: gpt-oss-120b с 120 миллиардами параметров (5,1 миллиарда активных) и gpt-oss-20b с 20 миллиардами (3,6 миллиарда активных). Обе версии доступны по лицензии Apache 2.0 — их можно модифицировать и использовать для коммерческих целей, указывает The Verge.
- TechCrunch отмечает, что это первые «открытые» языковые модели OpenAI со времени GPT-2, выпущенной более пяти лет назад. Есть демоверсия для разработчиков.
- По словам компании, gpt-oss-120b почти сопоставима с моделью o4-mini в основных бенчмарках и может работать на одном графическом процессоре с объёмом памяти 80 ГБ. Версия gpt-oss-20b показывает результаты, схожие с o3-mini, и использует 16 ГБ памяти.
Сравнение точности ответов моделей OpenAI в тесте «последний экзамен человечества», созданном для оценки способностей ИИ в академических вопросах. Источник: OpenAI
Сравнение точности ответов моделей OpenAI в «канонических бенчмарках». Источник: OpenAI
168 комментариев