{"id":2689,"title":"\u00ab\u041e\u0431\u043b\u0430\u043a\u0430\u00bb \u2014 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043c\u043e\u0434\u043d\u043e\u0435 \u043f\u043e\u043d\u044f\u0442\u0438\u0435, \u043d\u043e \u0438 \u043a\u0440\u0443\u0442\u043e\u0439 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442","url":"\/redirect?component=advertising&id=2689&url=https:\/\/dtf.ru\/promo\/1011062-kak-oblaka-pomogayut-pri-razrabotke-igr&placeBit=1&hash=9fdf930bb08dedc28192482dd577fa23bfc59c2419176d34c64e6c44fe8cc38c","isPaidAndBannersEnabled":false}
Евгений Приходько

[Когнитивочка] Эвристика репрезентативности

Немножко поговорим об основах статистики и еще раз обсудим то, как человеческий мозг не умеет в теорию вероятности. В этот раз получился большой пост с большим количеством примеров.

Я уже писал в прошлом посте, что такое эвристика, поэтому здесь повторяться не буду.

Начнем с типичного примера, который почти всегда приводится в том или ином виде, когда рассматривается эвристика репрезентативности. Предположим, нам говорят, что вот это три результата бросков монетки:

1
2
3

Первая последовательность в большинстве случаев не вызывает у человека вопросов. А вот вторая и особенно третья кажутся нам странными. Просто потому что в нашем представлении они не похожи на то, как выглядит результат случайного процесса. Вторая — слишком уж ровное чередование, не похоже, что это случайно бросали. Третья — везде один вариант, такого тоже не бывает, нас обманывают, монетка бракованная. На самом деле, все эти последовательности имеют одинаковую вероятность:

0.390625%
Появился повод воспользоваться этим бесполезным виджетом для чисел, давно мечтал.

Все из-за эвристики репрезентативности. Обратимся к википедии:

Репрезентативность — соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом. Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением определённой выборки на всю генеральную совокупность, из которой она была собрана.

Как и все определения из русскоязычной википедии, это звучит слишком сложно, потому давайте разбираться на примерах. Репрезентативность — это вообще термин из статистики. Мы говорим, что выборка репрезентативна, если она хорошо описывает генеральную выборку. Генеральная выборка — это все многообразие предметов или событий, которое нас интересует. Например, мы хотим собрать статистику, как много людей пользуется интернетом. Генеральная выборка — это все люди мира. Мы не можем опросить их всех, поэтому надо взять относительно небольшую выборку людей и опросить их. Но эта выборка должна быть репрезентативной, мы не можем взять кого попало. Есть даже хороший анекдот на эту тему:

Опрос в интернете показал, что 100% людей пользуются интернетом

Здесь как раз высмеивается пример нерепрезентативной выборки. Есть еще один хороший пример — предварительные опросы избирателей перед президентскими выборами в США в 1936 году. Там исследователи опрашивали людей по телефону и не учли, что телефоны были в основном у богатых, а они преимущественно поддерживали республиканцев (википедия). Вообще, собрать репрезентативную выборку сложно, про это диссертации писать можно (наверное). Кстати, на основе случайной выборки раньше работал SteamSpy, пока Steam не сделали аккаунты игроков закрытыми по умолчанию. Не знаю, что там теперь, нужно у Галёнкина спрашивать.

Еще одна штука из статистики и теорвера, которая нам сейчас нужна — это закон больших чисел. Грубо говоря, он означает, что если у нас большое количество событий (в идеале бесконечное), то распределены они будут согласно тому, что мы от них ожидаем с точки зрения математики. Мы знаем, что вероятность выпадения каждой из сторон монетки равна 50%. Если бы мы бросили монетку миллиард раз, то там четко было бы видно 50% для орла и 50% для решки. Проблема в том, что человеческий мозг пытается применять закон больших чисел к маленьким выборкам. Если у нас всего 8 бросков, то это ни в коем случае не репрезентативная выборка, там может быть что угодно — любой из перечисленных вариантов на картинках выше.

В каком-то смысле эвристика репрезентативности работает в ситуациях, обратных тем, что мы рассмотрели в посте про эвристику доступности. Эвристика доступности работает, если нам нужно оценить вероятность какого-то события. Эвристика репрезентативности работает, если мы видим уже готовый результат какого-то события. Мозг берет этот результат, осматривает его со всех сторон и сравнивает с тем, как он себе сам представляет типичный результат этот события. Иногда это работает, иногда — нет.

Примеры

Смешной мем из интернета

- Здесь у нас генератор случайных чисел

- 9, 9, 9, 9, 9, 9

- А вы уверены, что это случайные числа?

- В этом проблема случайности — ты никогда не можешь быть уверен.

Ошибка игрока или ложный вывод Монте-Карло

Это когнитивное искажение, из-за которого человек думает, что если на рулетке несколько раз подряд выпадает красное, то вероятность выпадания черного увеличивается. Хоть мы и знаем, что красное может выпасть сколько угодно раз подряд, так как это независимые события, из-за азарта и непонимания теории вероятности люди считают, что сейчас-то уж точно повезет, сейчас-то уж точно будет черное. Хотя я уверен, что если всегда будет выпадать красное, у людей появятся серьезные вопросы к этому казино.

У этого человека есть серьезные вопросы к этому казино.

Стереотипы и группы людей

Эвристика работает с выборками в целом, в том числе и с людьми. Возьмем для примера множество всех юристов. Мы их себе представляем в пиджаках и с дипломатами (например). Это будет наше генеральное множество. А теперь берем такого человека: кожаная куртка, рюкзак, темные очки, говорит, что он юрист, протягивает вам какую-то бумажку и просит подписать. Мозг берет все генеральное множество юристов из памяти, достает оттуда случайного юриста и сравнивает с человеком, которого он видит. Очевидно, тот странный человек не является репрезентативным представителем генерального множества юристов. Вообще, лучше у подозрительных людей ничего не подписывать.

Вот это юристы, вот это я понимаю, я бы подписал.

Несколько промахов подряд в XCOM

Многим знакомая ситуация. Если вероятность попадания 90%, а вы постоянно промахиваетесь, это не игра сломана, это так работает случайность. Тут еще подмешиваются другие когнитивные искажения, например, систематическая ошибка отбора и склонность к подтверждению своей точки зрения. Вы можете несколько часов играть нормально, а потом дважды промахнетесь. Из-за эмоциональной привязки промахи запомнятся гораздо сильнее. А после этого, как бы редко они не случались, мозг уже будет подмечать все промахи и запоминать только их. И решит, что в XCOM только промахи и есть.

Случайное воспроизведение песен в iPod

Говорят, когда только вышел iPod, люди жаловались, что случайное воспроизведение там плохо работает, так как почему-то один и тот же исполнитель может быть несколько раз подряд. Я думаю, вы уже понимаете, что проблема в людях, а не в iPod. В итоге, чтобы случайное воспроизведение ощущалось действительно случайным, его сделали менее случайным — алгоритм усложнили, чтобы он более равномерно подбирал песни разных исполнителей.

Пруфов истории у меня нет, прочитал про нее здесь, а там ссылаются на книгу Алекса Беллоса «Алекс в стране чисел. Необычайное путешествие в волшебный мир математики». Не читал, не знаю.

Традиционный котик
0
15 комментариев
Популярные
По порядку
Написать комментарий...
Всякий татарин

Это когнитивное искажение, из-за которого человек думает, что если на рулетке несколько раз подряд выпадает красное, то вероятность выпадания черного увеличивается.
Вот это до сих пор не понимаю. Понятно что красное/черное 50 на 50, но ведь это если не учитывать общую вероятность. Например если сделать банальный эксперимент то с большей вероятностью монетка будет выдавать 50 на 50 при 100 бросках и сомневаюсь что кому то удалось 100 раз выбросить решку. А значит при каждом броске вероятность другого исхода повышается, при 50 бросках одной стороной вероятность выбросить вторую сторону должна быть практически 100%

Ответить
1
Развернуть ветку
Евгений Приходько

Скорее всего ты смешиваешь вероятность единичного события и совместную вероятность группы событий. Давай разберем на монетках. В рулетке просто есть еще зеро, поэтому там не 50%.

Вероятность выпадения орла или решки одинаковая - 50%. Пишем, P(орел) = 0.5, P(решка) = 0.5.
Бросаем монетку, вероятность выпадения любой стороны P(x) = 0.5. Бросаем монетку еще раз. У нее нет памяти, прошлые броски на нее не влияют, поэтому вероятность выпадения любой стороны все еще P(x) = 0.5.

А теперь взглянем на совместную вероятность. Для совместной вероятности есть теорема Байеса, но мы знаем, что броски монетки независимые, поэтому она упрощается.
Совместная вероятность независимых событий - это произведение их вероятностей.
Вероятность, что выпадет 2 решки подряд: P(решка) * P(решка) = 0.5 * 0.5 = 0.25.
Вероятность, что выпадет 4 решки подряд: P(решка) * P(решка) * P(решка) * P(решка) = 0.5 * 0.5 * 0.5 * 0.5 = 0.0625.
Вероятность, что выпадет 8 решек подряд: P(решка) в 8й степени = 0.5 ^ 8 = 0.00390625.

Поэтому да, вероятность того, что выпадет несколько решек подряд сильно уменьшается с каждой следующей решкой. Но вот вероятность каждой новой решки все еще 50%.

Ответить
3
Развернуть ветку
Всякий татарин

Так ты же пишешь что человек не прав что если несколько раз выпадет красное то стоит ждать черного и это когнитивное искажение. А по второй части твоего сообщения он прав и это не когнитивное искажение, а вполне себе статистический расчет

Ответить
0
Развернуть ветку
Евгений Приходько

Ок, я вижу тут две причины, почему тебе может это казаться странным, давай разберем обе.

1. Вероятность выпадения любой последовательности цветов или сторон монетки - одинаковая.
4 решки подряд - 0.0625
4 орла подряд - 0.0625
2 решки, потом 2 орла - 0.0625
решка, орел, решка, орел - 0.0625

Тебе кажется, что 10 решек подряд - это такая редкость, а уж 11 - тем более, значит 11я скорее всего будет орлом.
Но на самом деле вероятность этих двух последовательностей тоже одинаковая:
Р Р Р Р Р Р Р Р Р Р Р (11 решек)
Р Р Р Р Р Р Р Р Р Р О (10 решек и орел)
Просто в первом случае все охренеют "О боже мой, 11 решек подряд!", а во втором посчитают, что ничего особенного.

Вероятность последовательности О Р Р О Р Р О О О Р точно такая же, как и у 10 решек. Если ты увидишь такую "обычную" последовательность, то тебе вряд ли покажется странным, что 11й бросок выпал решкой.
У этих ситуаций абсолютно одинаковая вероятность, но из-за эвристики репрезентативности 10 решек подряд тебе кажутся гораздо более значимым событием, мозг обращает на них внимание гораздо больше.

2. Тут важно понимать, что я учитываю порядок выпадения сторон монетки.
Если я пишу О Р Р О Р Р О О О Р, то я имею в виду, что они выпадают именно в этом порядке.
Если считать, что у нас из 10 бросков 5 решек и 5 орлов в любом порядке, то да, вероятность этого гораздо выше чем у 10 решек из 10 бросков.

Например если сделать банальный эксперимент то с большей вероятностью монетка будет выдавать 50 на 50 при 100 бросках и сомневаюсь что кому то удалось 100 раз выбросить решку.

Да, это так. Вероятность получить такое равна 0.5^100, что очень мало. Или в терминах шансов: 1 к 1,267,650,600,228,229,401,496,703,205,376‬.

А вот выбросить 50 решек и 50 орлов гораздо больше шансов, потому что мы можем делать это в любом порядке. Здесь уже используется центральная предельная теорема.
https://ru.wikipedia.org/wiki/%D0%A6%D0%B5%D0%BD%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%82%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0

Ответить
3
Развернуть ветку
Всякий татарин

Догнал

Ответить
2
Развернуть ветку
Золотой волк

Комментарий удален по просьбе пользователя

Ответить
1
Развернуть ветку
Евгений Приходько

Отрицание или преуменьшение влияния когнитивных искажений на свои решения - это тоже когнитивное искажение :)
https://en.wikipedia.org/wiki/Bias_blind_spot

Ответить
0
Развернуть ветку
Евгений Приходько

Меня больше раздражает подход "Раньше было лучше" - там тоже прям кладезь когнитивных искажений.

Ответить
0
Развернуть ветку
Оплот здравомыслия DTF

Игра в покер научила меня разбираться в вероятностях больше, чем 2 курса тервера в универе, лул.

Ответить
0
Развернуть ветку
Евгений Приходько

Проблема обучения теорверу на практике в том, что из-за когнитивных искажений можно сделать неправильные выводы.

Ответить
0
Развернуть ветку
Оплот здравомыслия DTF

Ну у меня вроде все относительно неплохо с этим. Я надеюсь, по крайней мере.

Ответить
0
Развернуть ветку
Евгений Приходько

Знал одного игрока в Magic: the Gathering, который занимал призовые места на европейских турнирах, но считал, что если карты земель на стартовой руке где-то в начале, а не в конце, то это значит, что вероятность вытянуть новые земли из колоды в следующий ход увеличивается. Т.е. это либо непонимание вероятности независимых событий, либо вера в приметы.

Не говорю, что ты ошибаешься, просто стоит иметь в виду, что такая вероятность есть :)

Ответить
0
Развернуть ветку
Оплот здравомыслия DTF

Не играл в МТГ, поэтому не особо понимаю, о чем речь, но надеюсь, что у меня не такой случай. ) Да это я к тому, что кто-то удивляется промахам при 90% в ХКОМ, а кто-то даже снял любительский фильм, очерняющий покер, где какой-то идиот (иначе не назову) поставил весь свой банкролл на одну руку на префлопе (вроде) - АА, а его переехали какой-то херней и парниша выпилился. И типа: "Не играйте в покер, это все говно, там одна (не)удача." Вот у меня нет подобного, я спокойно переживу и более сильные переезды, потому что понимаю, что сыграл я в +EV.

Ответить
2
Развернуть ветку
Евгений Приходько

Теперь уже я плохо понял, о чем речь, но это нормально :)

Ответить
1
Развернуть ветку
Оплот здравомыслия DTF

Ну там главное последнее понятно, что мат. ожидание мое было положительным, а значит в подобных ситуациях в будущем на дистанции, которая стремится к бесконечному числу сыгранных рук, я буду в плюсе по деньгам. С правильным их менеджментом, конечно. =D

Ответить
1
Развернуть ветку
Читать все 15 комментариев
null