Релиз семейства языковых моделей Qwen2.5

Релизнули сразу несколько версий - стандартная Instruct, Math и Coder в широком диапазоне размеров. Сразу же и подготовили кучу разных вариантов квантизаций для запуска в основных движках LLM. Просто образцовый релиз от китайцев.
Походу уже успели переобучить на "strawberry", даже самая маленькая модель на 0.5B справляется

Потому что с "raspberry" уже не справляется<br />
Потому что с "raspberry" уже не справляется
Релиз семейства языковых моделей Qwen2.5
33
15 комментариев

По приколу в кобальт пихнул 0.5B
Это легально что она на первом же запросе с ума не сходит если писать ей на русском?

1

меньше секунды на 1660ti+4800h

1

Лламы 3\3.1 и мистрали немо тоже не сходили с ума от русского. Впринципе давно было известно, что чем "умнее" модель тем проще ей обращаться с разными языками, так что тут видимо так же.