Отличный совет, а со стримингами что делать, те что через браузер
Особенность moe архитектуры, слои экспертов мелкие, быстрее чем кажется работает. Тот же квен 110b вполне 13-15т выдает, если память позволяет, то размер батча невелирует недостаток скорости обработки выходных данных. Попробуй для примера взять тот же квен3.6 модели на 35b и 27b, вторая вообще не взлетит даже в низком кванте, а первая вполне себе будет быстро и точно работать, особенно если слои внимания влезают на видеокарту, тоже самое и с последней геммой
Первый раз слышу. Понятно что такое вполне продолжение происходящего, но попасть туда смогут далеко не все разработчики игр
Оперативки если хватит, ему видеокарта особо то и не нужна
Так сами же этим и влияют
Напомню, что альтернативой этому предлагалась уголовная ответственность за впн
Лена Головач
Вариант голосовать рублем, и не жрать в маке
Ну это уже слишком, в нелюди, только за нетрадиционный выбор ориентации записывать...