Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта

Стог сена — рынок киберспортивных данных, а иголка — это искусственный интеллект DataLouna, прогнозирующий результаты CS:GO-матчей. Создать искусственный интеллект — нетривиальная задача, но разработка алгоритма для прогнозов матчей начинается не тогда, когда разработчик открывает редактор и пишет первую строчку кода.

Первым делом нужно определиться с тем, что влияет на исход матчей, как правильно собирать эту информацию, после чего постоянно тестировать и дорабатывать модель. В DataLouna.ru этим занимаются аналитики с огромным опытом на соревновательной сцене CS:GO.

Эрик «AKIMOV» Акимов играет в CS с нулевых и прошел путь от игрока в любительских лигах до работы профессиональным тренером и аналитиком. Проанализировал тысячи часов демок, помог десяткам игроков найти себя, а сейчас работает со всеми накопленными знаниями и делится опытом с остальной частью команды.

Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта

Второй аналитик DataLouna — Святослав «svyat» Довбах. За свою карьеру Svyat попал в топ-20 HLTV, дважды отбирался на мейджоры (на один из которых не получилось попасть из-за ковидных ограничений) и крупные международные LAN-турниры. В своих командах всегда был капитаном и частично совмещал тренерские обязанности.

Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта
Золотая наклейка Svyat'a в CS:GO. Любой игрок может купить ее и наклеить на любимый скин<br />
Золотая наклейка Svyat'a в CS:GO. Любой игрок может купить ее и наклеить на любимый скин

Краткое (и очень простое!) объяснение принципа работы нейросетей: машина обучается на тысячах матчей, находит закономерности в статистике и самостоятельно учится прогнозировать исходы матчей.

Понятно, что обучаться нужно на каких-то статистических данных, и самый очевидный вариант — пойти на HLTV (главный сайт со статистикой и новостями CS:GO) или в саму CS и взять все данные оттуда: киллы, ассисты, смерти, процент хедшотов, ADR, KAST и много других разных интересных аббревиатур. Так?

Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта

Обычная статистика вроде количества фрагов не объяснит, почему одна или другая команда выиграла матч. Это итоговый результат, ты не узнаешь за счет чего он получился из сухих цифр. И это мы еще не поднимали тему качества таких данных.

Казалось бы, что сложного посчитать понятные всем вещи, например, экономику? Но даже тут есть куча проблем, которые приходится решать аналитикам DataLouna.

Например, на HLTV используется только 4 типа закупа, когда на про-сцене их около 7, и их нельзя определить, просто подсчитав сумму потраченных денег.

Экономика, которая используется на сайтах вроде HLTV, и на про-сцене или в ДатаЛуне — это небо и земля. Количество денег недостаточно определяет, какой бай сейчас у команды, какая у нее огневая мощь.

Просто количества денег мало.

Экономика влияет на игру очень сильно, это один из ключевых факторов на шансы в раунде. С хорошей экономикой у команды появляется преимущество, дополнительная возможность. Воспользуется ли команда этой возможностью — другое дело

Svyat

Есть ли предел в количестве собираемой ДатаЛуной статистикой, и когда надо остановиться?

Сейчас аналитики разработали более 400 ивентов (статистических событий), которые уже учитываются в модели или находятся в разработке у программистов. И это не только экономика, вот несколько фундаментальных примеров, которые будут завязаны с другой статистикой:

Тепловые карты рисуются игроками-гиками и компаниями, но это скорее красивая игрушка, а не широко применяемый инструмент аналитики<br />
Тепловые карты рисуются игроками-гиками и компаниями, но это скорее красивая игрушка, а не широко применяемый инструмент аналитики

В некоторых ивентах я уверен, буду топить за них при разработке, потому что знаю по своему опыту, что эта вещь не может не влиять. Это может быть субъективная оценка, но она выработана опытом и не одним годом потраченного времени”, — рассказал о планах Эрик Акимов.

Вот пара примеров статистики, которая собирается в связке с геометрией карты и не только:

Можно придумывать все, на что хватит фантазии

AKIMOV

В чем проблема текущей модели DataLouna, и как она будет улучшена

Несмотря на то, что средняя точность предсказаний DataLouna.ru чуть больше 70%, в прогнозах есть один большой вызов.

Сейчас искусственный интеллект анализирует данные и делает прогноз на основе команды как единого целого. То есть все данные о сильных и слабых сторонах игроков собираются в одно целое, условно мы называем такую модель “команда - карта”.

И если команда решафлится, то модель первое время работает хуже — она работает только со статистикой на уровне команды, не видит отдельных игроков. Поэтому в первый день турнира, перед которым прошло много решафлов, результат может быть плохим . Но из-за того, что модель обучается на свежих данных, второй турнирный день будет лучше. А следующий — еще лучше.

Мы учли эти недочеты и уже тестируем новую модель “игрок - раунд”, и она показывает лучшие результаты. Теперь искусственному интеллекту не понадобится день на “разогрев” — модель с самого начала начнет выдавать лучшие результаты, и при этом продолжит дообучаться по ходу соревнования.

Как мы прыгнули в огромный стог сена и случайно напоролись на иголку, которая может изменить рынок киберспорта

“Если мы начнем смотреть от раунда и игрока, у нас будут более точные данные, и мы сможем лучше прогнозировать тот или иной исход.

Это то, что было нужно сделать сразу, но на тот момент это было долго и сложно, даже невозможно. Сейчас же это наши ближайшие планы”, — рассказал AKIMOV.

Чего уже добилась DataLouna и где следить за ее успехами

Любой может зарегистрироваться на DataLouna.ru, на сайте есть все исторические данные — 427 проанализированных матчей топ-турниров с начала 2022 года.

Мы не скрываем неудачи (полная статистика прогнозов доступна на сайте бесплатно после регистрации), но одновременно гордимся своими успехами — после месячного перерыва в соревновательном сезоне наша модель смогла правильно спрогнозировать результаты 70% матчей BLAST Premier Fall Groups 2022.

Статистика BLAST Premier Fall Groups 2022<br />
Статистика BLAST Premier Fall Groups 2022

Модель прогнозирует некоторые вещи, про которые я бы никогда не подумал. И она это уверенно делает.

Было несколько матчей, например Vitality против G2 на BLAST Fall Groups. Там DataLouna смогла правильно спрогнозировать победу андердога (G2), при этом модель предсказала поражение G2 на своем пике карты и победу на пике соперника — это встречается в матчах такого высокого уровня не так часто.

То, что ИИ еще не сделан до конца, а уже находит такие важные кейсы, очень вдохновляет

AKIMOV
Тот самый прогноз на матч G2 — Vitality<br />
Тот самый прогноз на матч G2 — Vitality

Следить за успехами ИИ можете и вы — подписывайтесь на VC (и на DTF) или регистрируйтесь на DataLouna.ru, чтобы посмотреть на результаты работы команды аналитиков и программистов.

Связаться можно через личные сообщения на VC/DTF или CEO@datalouna.ru

В следующем посте мы расскажем о взгляде на проект программистов — это будет продолжением серии постов о DataLouna. Предыдущие посты:

66
14 комментариев

Азартные игры и те что это говно подстегивает должны гореть в аду

2
Ответить

В азартные игры можно играть без азарта, это выбор человека. Также как пить, курить или принимать запрещенные вещества.

Проект не подстегивает людей играть в бк, а лишь демонстрирует, что "казино не всегда в плюсе"

Ответить

после месячного перерыва в соревновательном сезоне наша модель смогла правильно спрогнозировать результаты 70% матчей BLAST Premier Fall Groups 2022

Просто интересно, какая будет точность если всегда ставить на команду с наименьшим коэфом? Больше или меньше 70%?

1
Ответить

По опыту, все зависит от турнира

К примеру, на одном может быть 44% на другом 80%
В среднем — это 69%, но стратегия ставок на команду с наименьшим кэфом на долгосроке показывает минус 100 и более процентов от банка

1
Ответить

Комментарий недоступен

Ответить

Ставки это одно из применений этой технологии. Каждый 4й матч, который мы предсказываем с противоположными коэффициентом. Можете сами убедиться на сайте

Ответить