Подъехал свежий бенчмарк по нейросетям — эксперты Arabian Business оценили лучшие LLM-модели.
Первое место уверенно держит GPT-4, второе — у свежего Claude-3. Для теста выбрали интересный метод: слепо оценивали по side-by-side тестированию — в первую очередь на их «родном» языке, а также на любом другом случайном. Эксперты оценивали нейронки по следующим критериям: перевод, креативный текст, генерация кода и анализ данных.
Приятно удивил GigaChat — он стал лучшей моделью на русском языке, обогнав показатели GPT-3.5 и Gemini от Google.
Изначально это новость мы объявили в нашем тг канале- https://t.me/NeuroNet_neuroseti подпишись чтобы не пропускать новости из мира ии.