[D&D турнир] Результаты групповой стадии
Как вы все прекрасно помните... Как не помните? Ну вот июльский пост, вспоминайте:
Мне стало интересно поизучать до чего развились современные нейронки. Смогут ли они в ближайшие годы заменить опытного мастера подземелий (DM) в настолках и компьютерных играх?
Для этого я скидывала промпты чат-ботам с просьбой рассчитать бои между двуми персонажами D&D пятой редакции. Чтобы совместить приятное с полезным я устроила турнир, где любой неленивый дтфер мог выиграть целую котыщу просто создав максимально убойного персонажа D&D5e первого уровня.
В турнире принимает участие 10 человек: 3 монаха, 2 варвара, 2 плута, воин, чародей и колдунья.
Листы персонажей можно посмотреть здесь:
Месяц с небольшим я проводила исследование, подбирала оптимальный промпт, работала в разных чат-ботах, экспериментировала. Поэтому турнир так долго задерживался.
По итогу:
- DeepSeek вообще не пригоден для расчета D&D боёв. Я провела в нем порядка 50-ти битв и ни один не был без ошибок! Представьте что Вашу игру проводит пьяный DM, он знает правила, но очень сильно тупит: бросок атаки d20+4 с результатом 22 считает за крит! И Вы такой: "Ты чё тупой? Это не крит". А он: "Ах да, точно Вы абсолютно правы, давайте пересчитаю...". И пересчитывает с новой ошибкой. ¯\_(ツ)_/¯ Нейросети...
- ChatGPT наголову лучше DeepSeek, но всё равно процент ошибок порядка 0-20% в зависимости от боя. Тот же пьяный DM.
- Gemini примерно тоже качество что и ChatGPT. Надо отметить что из всех 4 нейронок здесь был самый сильный AI: персонажи-бойцы действовали как живые люди. Но к сожалению частые ошибки дали о себе знать.
- Grok в режиме Эксперта: то что доктор прописал! После остальных чат-ботов это просто небо и земля: долго "думает", исправляет ошибки в листах персонажей. Ошибки тоже есть но их предельно мало по сравнению с коллегами.
Надо отметить что все чат-боты примерно одинаковы по знаниям. Если нейронке указать на её ошибку, то она её увидит и напишет как должно быть. Ошибки происходят из-за того, что все чат-боты заточены под быстрый ответ пользователю.
Для машины правила D&D намного сложнее чем какой-нить Python. В отличии от программирования, где есть паттерны решения задачи, D&D требует постоянной проверки состояния игры: кто, где стоит, под каким эффектом, чем бьёт и т.п. Надо учитывать десятки сложных нюансов ролевой системы. Если нейронка долго "думает", перепроверяет себя и исправляет ошибки - она мало чем отличима от живого DM.
Поэтому для турнира выбираем Grok как наиболее оптимальный вариант.
Как считаются бои?
Разбиваем 10 участников на 2 группы по 5. Проводим серию игр между всеми участниками группы. Каждая игра - бои до двух побед (Best of 3).
Чат-боту даётся промпт:
Где листы персонажей такого формата:
Хватит на сегодня технической части. Начинаем турнир!
Групповая стадия. Группа A
Тик-Так - Корвус
Тик-Так - Ранс
Тик-Так - CrazyMaks
Тик-Так - Чак Фаустовский
Корвус - Ранс
Корвус - CrazyMaks
Корвус - Чак Фаустовский
Ранс - CrazyMaks
Ранс - Чак Фаустовский
CrazyMaks - Чак Фаустовский
Групповая стадия. Группа Б
Колдослав - Гэлуа
Колдослав - Семирамида
Колдослав - Джин Китсураги
Колдослав - Лю Цзе
Гэлуа - Семирамида
Гэлуа - Джин Китсураги
Гэлуа - Лю Цзе
Семирамида - Джин Китсураги
Семирамида - Лю Цзе
Джин Китсураги - Лю Цзе
Итоговые результаты
Тик-Так и Семирамида, занявшие 5 места в группах выбывают из турнира. =(
Основная часть турнира будет проходить по схеме Double Elimination: 2 сетки с "виннерами" и "лузерами", чтобы вылететь из турнира надо проиграть 2 раза.
Как Вы думаете кто победит в турнире? Я бы поставила на Колдослава: полуорк, высокий AС, каст сна от которого нет спасброска(если вы не эльф) и удар по спящему с преимуществом с уроном 3d8+2 !