Наконец-то! Математическое доказательство рациональности выбора красной кнопки

Когда-то давно, в период хайпа этого вопроса, я обещал строго математически доказать,

почему выбор красной кнопки рационален не только для ценящих выше всего собственную жизнь (для них это очевидный выбор), так и для тех, кто стремится максимизировать число выживших. А значит выбор синей кнопки контрпродуктивен.

Что ж, тогда я не справился с теорией вероятности и забил. Но теперь у нас есть ИИ, а ему эта задачка на зубок.

Задача

Имеются две кнопки, красная и синяя:

  • Нажавшие красную выживают гарантированно
  • Нажавшие синюю выживут, если их число окажется больше или равно половины участников

Все выбирают одновременно. Ни у кого нет никакой информации, кто чем руководствуется при выборе, и сколько всего участников.

UPD: В оригинальной дилеме формулировка была следующая:
Есть две кнопки: синяя и красная.
- Если синюю нажмут больше 50% людей, то все выживут.
- Если ты нажимаешь красную, то ты выживешь, но нажавшие синюю умрут, если не наберут 50%.

Можете сами убедиться, что это одна и та же диллема, но поданная иначе.

Для начала, проголосуем?

Какую выберешь?
Красную
Синюю

Основной тезис

При полной неопределенности о числе участников и их стратегиях, выбор красной кнопки математически предпочтительнее для любого рационального игрока, независимо от этической установки (собственное выживание vs максимизация общего выживания).

Постановка задачи

Рассматривается игра с следующими параметрами:

  • N участников одновременно выбирают между красной и синей кнопкой
  • Красная кнопка: гарантированное индивидуальное выживание
  • Синяя кнопка: выживание всех участников, если синих ≥ 50%, иначе - смерть
  • Условия: полная неопределенность о N и стратегиях других игроков
  • Цель: максимизация математического ожидания числа выживших

Математическое обоснование

Формализация

Пусть X - количество игроков (кроме нас), выбравших красную кнопку.

Пусть s ∈ {red, blue} - наша стратегия.

Число выживших:

  • При s = red: N, если X ≤ ⌊N/2⌋ - 1; иначе X + 1
  • При s = blue: N, если X ≤ ⌊N/2⌋; иначе X

Математические ожидания

E[выживших | red] = N·P(X ≤ ⌊N/2⌋ - 1) + E[X + 1 | X > ⌊N/2⌋ - 1]·P(X > ⌊N/2⌋ - 1)

E[выживших | blue] = N·P(X ≤ ⌊N/2⌋) + E[X | X > ⌊N/2⌋]·P(X > ⌊N/2⌋)

Принцип максимальной энтропии

При полном отсутствии информации применяем равномерное распределение: X ~ U[0, N-1]

Асимптотический результат

При больших N:

  • P(X ≤ ⌊N/2⌋ - 1) ≈ 1/2
  • P(X ≤ ⌊N/2⌋) ≈ 1/2
  • E[X | X > ⌊N/2⌋] ≈ 3N/4

Результат:

  • E[выживших | red] ≈ 3N/4 + 1/4
  • E[выживших | blue] ≈ 3N/4 - 1/4

Вывод: E[выживших | red] > E[выживших | blue]

Объяснение для не умеющих в математику

Представьте, что вы организуете спасательную операцию, не зная точного числа людей в опасности и их намерений.

Синяя стратегия ("все или никто") работает только при идеальной координации. Если хотя бы половина людей выберет "безопасный" вариант, то смелые герои, выбравшие "коллективное спасение", погибнут напрасно.

Красная стратегия ("индивидуальная безопасность") гарантирует, что по крайней мере вы точно выживете. Парадоксально, но математика показывает: если все думают именно так, общее число выживших в среднем больше, чем при "альтруистической" стратегии.

Это происходит потому, что неопределенность делает координацию практически невозможной, и "эгоистичный" выбор становится более надежным способом сохранить жизни.

Ответы на возражения

"Это противоречит интуиции о коллективном благе"

Ответ: Интуиция верна для случаев с полной информацией и возможностью координации. В условиях полной неопределенности математика показывает обратное.

"А если все будут думать одинаково?"

Ответ: Именно это мы и анализируем. Если все рациональны и выбирают красную - выживают все. Если все выбирают синюю - тоже выживают все. Но при смешанных стратегиях красная дает лучший результат.

"Это оправдывает эгоизм"

Ответ: Нет. Мы показываем, что в условиях неопределенности "локальная рациональность" может служить "глобальному благу" лучше, чем прямое стремление к нему.

"А если применить другие распределения?"

Ответ: При любом симметричном распределении X результат качественно сохраняется. Принцип максимальной энтропии делает равномерное распределение наиболее обоснованным выбором.

Ограничения исследования

Данный анализ справедлив исключительно для следующих условий:

  1. Полная неопределенность о числе участников и их стратегиях
  2. Одновременность принятия решений (отсутствие коммуникации)
  3. Две этические установки: собственное выживание vs максимизация общего выживания
  4. Рациональные агенты без когнитивных искажений

Альтернативные контексты

В других условиях решение может кардинально отличаться:

  • При возможности коммуникации оптимальна координация на синюю стратегию
  • При частичной информации о намерениях других игроков
  • При повторяющихся играх с возможностью обучения
  • При неравных "весах" жизней (например, учет возраста, социальной ценности)
  • При альтернативных этических системах (деонтологическая этика, этика добродетели)

Заключение

Парадокс дилеммы красной и синей кнопки демонстрирует фундаментальную проблему коллективного действия в условиях неопределенности. Математический анализ показывает, что интуитивно "эгоистичный" выбор может служить общему благу лучше, чем прямой альтруизм.

Это не призыв к эгоизму, а демонстрация важности информации и координации для эффективного коллективного действия. В реальных кризисных ситуациях ключевую роль играют институты доверия и механизмы координации, позволяющие преодолеть неопределенность.

Если найдете ошибки в вычислении матожидания - буду благодарен. Я все еще не оч силен в тервере.

P.S. Я интересуюсь множеством тем, от ИИ и философии сознания, этики и науки до психологии и психпросвета. Если вам интересно следить за моими открытиями и хот-тейками, хотите горячую, но взаимоуважительную дискуссию или просто ищете полезное и познавательное - добро пожаловать в мой ТГК:

6
5
4
2
1
69 комментариев