Игры
Rettro
1227

Команда ботов на основе нейросети в DOTA 2 - текущие результаты

Некоммерческая организация OpenAI, поделилась своими достижениями касаемо искусственного интеллекта в DOTA 2. Занимательный факт: одним из основателей был Илон Маск
В закладки

Слухов, новостей о искусственном интеллекте сплошь и рядом. В прошлом году программа AlphaGo уничтожила сильнейшего игрока в Го Кэ Цзея. Сам факт примечателен тем, что изначально считалось, будто бы ИИ никогда не сможет достичь таких высот. От тех же шахмат она отличалась тем, что оказалась наиболее сложной для компьютера. В шахматном мире революция произошла с конца 1990-х, в Го только к 2015 году компьютер смог обыграть человека. Основными затруднительными факторами для компьютера в отличии от шахмат оказались:

  • Невероятное число вариантов ходов
  • Вариативность выбора позиции

Я столкнулся с холодным, спокойным и ужасающим противником. Я мог предсказать лишь половину ходов AlphaGo.

Кэ Цзе - был сильнейшим игроком в го на 2017 год
игрок в Го

В Го много вариативности. В DOTA 2 ее еще больше.

Не буду говорить о более ста героях, пиках и контрпиках, характеристиках. Привожу данные OpenAI:

  • Средний матч длится 45 минут, что составляет 80 тысяч кадров игры. Каждый четвертый кадр анализирует алгоритмы - около 20 тысяч шагов за одну игру. В шахматах партия длится меньше: 40 ходов, в Го менее 150. Алгоритму необходимо выбрать один шаг, заранее просчитав тысячи возможных для героя, принимая решение мгновенно. В настольных играх можно обдумать свои действия, есть таймер, в Доте, как мы знаем, вас никто не будет ждать. Ко всему прочему задача ИИ усложняется "туманом войны".
  • Для проработки ИИ потребовалось: 256 GPU и 128.000 СPU ядер. Боты делают по 150-170 действий в минуту. Чтобы принять решение на каждом из 20 тысяч ходов, тратят около 80 миллисекунд. Сотрудники OpenAI утверждают, что это меньше, чем уходит на принятие решения у проф. игроков.

Результаты

Думаю, многим известна первая публичная демонстрация бота основанного на ИИ. В прошлом году на The International, в рамках шоу-матча он впервые схлестнулся с Dendi. Как результат, игрок известной киберспортивной организации NA'VI - проиграл. Говорят, Dendi не проигрывает мид, а зачастую и выигрывает.

А сейчас?!

С тех пор многое изменилось. Теперь они играют в команде, под кодовым названием OpenAI Five. У них полноценное самообучение, так сказать, в вакууме (им не показывали записи игроков). С каждым новым матчем они все более совершенствуются. Сначала они бродили по карте, не ведая куда, как слепые котята, спустя же пару дней обучились базовым стратегиям. Тренировки идут в следующем ключе. Каждую следующую игру они играют с предыдущей версией себя, то есть с более слабой. За 24 часа нейросеть симулирует 180 лет игры.

Видео с геймплеем команды ботов

В мае и июне OpenAI провела серию игр против команд из живых людей. Людей представляла команда разработчиков. Понятное дело, они не шибко сильные, но задача была проверить на что, собственно, стали способны боты. В мае они сумели выиграть один матч, но проиграли другой. Спустя три недели они уже смогли обыграть две другие команды, состоящие из сотрудников VALVE.

Основные факторы подобных игр:

  • Боты играют фиксированным пулом героев, что и их оппоненты
  • Нет речи играть стаком ботов против профессионалов, до этого все-таки еще очень далеко, но первые шаги впечатляют
  • Суммарно на тренировку боты потратили более тысячи лет
  • Разработчики обещают в скором времени снять ограничение состоящее из определенных героев
  • Игрокам нельзя было использовать руны невидимости, а также иллюзии
  • Были ограничения и по сборкам

Напоследок, возникает немного наивный вопрос. Понятное дело, профит для технологий очевиден за счет DOTA 2, а в чем, по вашему мнению, заключается профит для самой игры?

{ "author_name": "Rettro", "author_type": "self", "tags": ["\u0445\u043e\u0447\u0443\u0432dtf","\u0433\u043e","dota2","dendiface","cybersport"], "comments": 20, "likes": 19, "favorites": 5, "is_advertisement": false, "subsite_label": "games", "id": 22315, "is_wide": false, "is_ugc": true, "date": "Wed, 27 Jun 2018 22:38:17 +0300", "is_special": false }
Промо
Чистые поезда: новые технологии для обеззараживания воздуха, воды и поверхностей в вагонах
Благодаря установкам для дезинфекции, поезда могут по праву считаться одним из самых безопасных видов транспорта.
Объявление на DTF
0
20 комментариев
Популярные
По порядку
Написать комментарий...
3

Как-то устраивал на фб трансляцию как нейронка на lua учится играть в Марио, медетиативное зрелище вышло:
https://www.facebook.com/Denis.Sergeevitch/videos/10210840899039062/

Вообще готов наблюдать за алгоритами в любом проявлении

Ответить

Муниципальный вентилятор

Denis
3

Играет прям как тот журналист в Cuphead.

Ответить
2

Да, только журналист так и не обучился игре ))))

Ответить
0

Сам писал нейронку?

Ответить
2

Нет, это один из множества проектов Mario i/o, сам я настраивал все и заводил, там небольшой геморрой

Ответить
0

Ясно я просто как то видел как на этом или другом проекте нейронка проходила уровень влет причем и кубы разбивала и прыгала между огней очень точно.

Ответить
0

Зависит от времени тренировки, нейронка из моего поста так же делает через пару часов работы :)

Ответить
0

Но всё равно спасибо, пойду почитаю о проекте этом.

Ответить
2

Начните отсюда, крутой канал и видео

Ответить
1

“ профит для игры
Неограниченное количество тестеров любого уровня которые «сжимают» время

Ответить
0

А как бот поймет, где баг, в где фича? Я и сам то не всегда понимаю...

Ответить

Комментарий удален

0

Думаешь, он пощадит создателей?

Ответить
3

Конкретно этот чувак на флейте поиграет.

Ответить
0

А потом будет целоваться сам с собой, пока тебя монстры будут жрать.

Ответить
0

а в чем, по вашему мнению, заключается профит для самой игры?

реклама

Ответить

Комментарий удален

0

Правильно, разъебут сначала ядерной бомбой, а потом зачистят остатки.

Ответить
0

а в чем, по вашему мнению, заключается профит для самой игры?

ну был же видос, после первого показа одинокого бота, где про игроки говорили про него, что 1на1 он играет механически идеально, и это будет супер полезно тренироваться против него

Ответить
0

можно на твитче включить бесконечные стримы, к которым до кучи прикрутить голосовых помощников-комментаторов, и ковать бабло

Ответить
0

Странно сравнивать Доту и Го. Не потому что игры разные, а потому что команды разработчиков ии разные. Соответственно и технологии могут кардинально отличаться.

Ответить
0

Вы правы, по своему. Задача была привести пример в соотношении, на деле. Это было большим событием в мире ИИ.

Ответить

Комментарии

{ "jsPath": "/static/build/dtf.ru/specials/DeliveryCheats/js/all.min.js?v=05.02.2020", "cssPath": "/static/build/dtf.ru/specials/DeliveryCheats/styles/all.min.css?v=05.02.2020", "fontsPath": "https://fonts.googleapis.com/css?family=Roboto+Mono:400,700,700i&subset=cyrillic" }