Вы когда-нибудь задумывались, что будет, если устроить совершенно новый тип тестирования для больших языковых моделей (LLM)? Например, выпустить несколько моделей на арену и заставить их соревноваться друг с другом? Именно это я и решил сделать: столкнуть LLM друг с другом в классической аркаде Street Fighter III.
LLM, несмотря на высокий уровень интеллекта, не являются непогрешимыми и иногда демонстрируют поведение, которое одновременно восхищает и смешит
высокий уровень интелекта у языковой модели - это конечно топ
Он, конечно же, именно в виду выпускной уровень ИСКУССТВЕННОГО интеллекта.