Теорія Ймовірності
|
|
|
Вступ
Як правильно викидати шістки на кубиках? Як підрахувати кількість листя на дереві? Хто склав гороскоп Ісуса Христа? Навіщо змішувати чай із горілкою? Що дозволяє нам оцінювати та розподіляти ризики через процес збирання їх у купу та повсюдного розмазування? Чому 95% населення – ідіоти? Запитання ці вкрай важливі! Поїхали!
Теорія ймовірності
Теорія ймовірності як мисленна конструкція з'явилася в конкретний момент часу, і в неї надзвичайно широкий спектр застосування. Сподіваюся, навіть басисти все зрозуміють, пояснюватиму на пальцях. На двох.
Почнемо з концепції ймовірності. Що це таке? Можливість невіддільна від події. Яка ймовірність того, що зарплата цього року зросте? Ну, думаю, відсотків 60. Це означає, що у 60 випадках зі 100 вона зросте, а у 40 — впаде чи залишиться на тому ж рівні. Це приблизно зрозуміло. Якщо хтось каже, що ймовірність чогось становить 40 відсотків, вам зрозуміло, що це означає.
Хочу наголосити на тому, що це не завжди було зрозуміло. Тому що концепція народилася тільки на початку 16-го століття, а до цього ніхто ніколи такого слова не вимовляв. І це серйозна відмінність від інших галузей математики: у геометрії чи матаналізу були середньовічні і навіть античні попередники, а от у теорії ймовірності нічого не було.
У самого слова «імовірність» значення якесь туманне. Люди розумом начебто й розуміють, що це об'єктивна реальність, але серцем прийняти цього не можуть. Навіть зараз через 400 років після появи теорії. Це багато разів демонстрували будь-які дослідження. Наприклад, якщо запитати людину, яку ставку вона готова зробити на кидок монети, вона поставить більше грошей, якщо монету кидає вона сама або якщо вона ще не кинута. Ну, тобто її можна кинути і накрити рукою, і тільки після цього запитати, скільки вона ставить, п'ять карбованців чи десять. І людина менше ставить грошей у такому разі. З чого б це?
Вона інтуїтивно вважає, що є якісь магічні сили всередині, які нібито можуть вплинути на те, що випаде. З боку це слухати досить смішно, але уявіть себе в цій ситуації, і ви зрозумієте, що вам не подобається робити ставку на вже підкинуту монету.
ЩОБ ЗРОЗУМІТИ, ЯК ПРАЦЮЄ ІМОВІРНІСТЬ, ТРЕБА СПОЧАТКУ ЗРОЗУМІТИ, ЩО ТАКЕ ВИПАДКОВА ПОДІЯ, А ІНТУЇТИВНО ЦЕ НЕЗРОЗУМІЛО.
Багато людей думають, що вони можуть впливати на випадковість якимось чином. У мене є товариш, який думає, що найчастіше викидає шістки на кубиках. Якщо з таким підходом починати освоєння теорії ймовірності, буде біда.
А базова думка теорії ймовірності в тому, що ні, не вдасться змінити цю подію. Є об'єктивні закони, які керують світом. Більшість мов мають різні слова для позначення успіху та ризику — але, що характерно, англійською «фортуна» — fortune — означає, зокрема, і багатство. «Успіх», проте, розповідає щось про людину — ну, типу, «я щасливий, і мені благоволіє всесвіт», або бог чи сатана, або «сьогодні видався вдалий день». А теорія ймовірності — це крок у протилежний, неприємний для багатьох бік. Тут є математично вивірені закономірності.
Є такий канадський чел, Ієн Хекінг, який займався історією теорії ймовірності; він прошерстив світову літературу щодо вживання терміна «імовірність» і знайшов нічого раніше 1600 року. Там величезний стрибок стався в 17-му столітті, і після нього стало навіть якось модно думати про речі в парадигмі ймовірності, це поширилося по всьому світу. Але раніше термін не вживався. Цей канадець знайшов деяких людей, які мали думки в правильний бік, але вони їх не публікували.
Чому? Тому що люди, які в цьому хоч щось розуміли, всі розумні думки тримали при собі. Адже вони були гравцями, а теорія ймовірності є дуже корисною, якщо ви граєте в азартні ігри. Хекінг припускає, основні концепції деяким були відомі, але їх зберігали в секреті і навіть не записували.
Але якщо у вас немає чіткої теорії, не можна нічого спрогнозувати. А якщо немає жорстких рамок та формул, не вдасться зробити акуратний розрахунок. І ось у 17-му столітті цю теорію почали нарешті записувати.
Історія
Перші завдання ймовірністного характеру виникли в азартних іграх — у кості, карти. Французький священик 13 століття Рішар де Фурніваль підрахував усі можливі суми очок після кидка трьох кубиків — кому як не священикові грати в кості — і вказав кількість способів, якими може вийти кожна з цих сум. Це число можна розглядати як перший обчислюваний захід очікуваної події — по-нашому, якраз ймовірності. До Фурнівалю, та й після нього теж, цей захід часто підраховували невірно, вказуючи, наприклад, що суми в 3 та 4 очки рівноймовірні. Адже обидва можуть вийти як би «тільки одним способом»: за результатами кидка «три одиниці» та «двійка з двома одиницями» відповідно. Де Фурніваль не догнав, що хоча три одиниці і справді виходять лише одним способом: 1+1+1, двійку з двома одиницями можна викинути цілими трьома способами: 1+1+2, 1+2+1 та 2+1+1, тож ці події зовсім не рівноймовірні. Сума у чотири очки випадає втричі частіше, хоча це теж трапляється рідко, в середньому лише кожен 72-й кидок. Аналогічні помилки неодноразово траплялися й у подальшій історії.
Екстравагантний математик 16 століття Джероламо Кардано прославився тим, що вилікувався від імпотенції, після чого народив трьох дітей. Сильно вразився, став і сам лікувати, а так як людиною був розумною і дивною, лікував він добре і нажив собі безліч ворогів. Його син теж прославився, тому що дико отруїв свою дружину, через що тато остаточно з глузду з'їхав, склав гороскоп Ісуса Христа і потрапив у катівні інквізиції. Присвятив аналізу гри змістовну книженцію «Книга про гру в кості» (1526, опублікована посмертно).
Кардано провів уже безпомилковий аналіз для значень суми очків трьох кубиків і вказав для різних подій очікуване значення частки «сприятливих» подій: наприклад, при киданні 3 кубиків частка випадків, коли значення всіх трьох збігаються, дорівнює 6/216 або 1/36. Начебто й очевидно, що їх лише шість — три одиниці, три двійки, ну і так далі, лише 6 граней, але до цього (та й після) якісь були проблеми у людей із цією концепцією.
Саме Джероламо Кардано запропонував формулювання ймовірності — що це число сприятливих наслідків, поділене на число всіх можливих наслідків. Кардано зробив ще одне дуже проникливе зауваження: при невеликій кількості ігор реальна кількість досліджуваних подій може сильно відрізнятися від теоретичного, але чим більше ігор у серії, тим ця різниця менше. По суті, Кардано підійшов до поняття ймовірності і заявив про закон великих чисел.
Голландець Крістіан Гюйгенс був досить просунутим челом: у 17-му столітті знав 5 мов, грав на скрипці, лютні та клавесині, у 13 років побудував собі токарний верстат. У 13 років! У нас діти он в камплюхтер грають і в ютюбах залипають, а Гюйгенс, він ось ходив в верстатобудівний гурток.
Він ще наловчився вирізати зі скла лінзи і їх ганчірочкою шліфувати, після чого зібрав окуляр для телескопа і виявив кільця Сатурна (Галілей їх теж виявив, але так і не зрозумів, що це таке, а Гюйгенс зрозумів), винайшов маятниковий годинник і - увага - діапроектор, щоб дивитися "губку боба" на слайдах. Годинник його конструкції був точний і недорогий і швидко поширився по всьому світу. А ще Гюйгенс написав першу книгу про ймовірність. Такий був чудовий голландець, ну ви розумієте, що йому там стало натхненням.
А далі ось що відбувається: розвивається геодезія, астрономія та стрільба, наприклад. І теорія ймовірностей починає застосовуватися теоретично помилок спостережень, як лягають кулі навколо мішені. І тут треба сказати про Лапласа, П'єра-Симона. Він опублікував два закони розподілу частотності помилок, і другий із них називають гаусовим розподілом. Справа в тому, що більшість випадкових величин з реального життя, таких, наприклад, як помилки вимірювань стрільби та іншого, можуть бути представлені як аналіз великої кількості порівняно малих помилок, кожна з яких викликана дією окремої причини, яка не залежить від інших. Наприклад, тремтінням руки — рука ж щоразу по-різному смикається.
А другий закон Лапласа свідчить, що частота помилок – статична функція від квадрата помилки, що нині називається нормальним розподілом, а крива – гауссіаною. Гаусс (до речі, Карл), звичайно, теж був дуже розвиненою дитиною, але в той час йому було 2 роки від народження, і він поки що погано ще закони формулював. Але він виріс і авторитетом задавив бідного Лапласа (т_т).
Незалежність
Зараз я хочу пробігтися деякими термінами — для когось це буде повторенням, але все одно не зашкодить. Імовірність найчастіше позначається латинською літерою p (від слова probability). Це завжди число, яке лежить між нулем та одиницею, ну або від нуля і до 100 процентів.[1] «Про цент» - це латинською «розділити на сто», тому 100 % і є одиниця. Якщо ймовірність події - 0, це означає, що вона не може статися. Якщо ймовірність дорівнює 1, вона обов'язково відбудеться. У цьому є основна ідея.
ОДИН З БАЗОВИХ ПРИНЦИПІВ — ЦЕ ІДЕЯ НЕЗАЛЕЖНОСТІ. ІМОВІРНІСТЬ ПОЗНАЧАЄ ШАНСИ НАСТАННЯ БУДЬ-ЯКОЇ ПОДІЇ.
Наприклад, результату якогось експерименту на кшталт кидка монети. Імовірність того, що якщо ви підкинете монету і вона впаде орлом, дорівнює одній другій, тому що у неї однакові шанси впасти орлом або рішкою. [2] Незалежні експерименти – це такі експерименти, які відбуваються – сюрприз! - незалежно один від одного. Якщо ви кидаєте монету двічі, результат першого кидка ніяк не впливає на результат другого, і тоді ми кажемо, що це незалежні величини. Між ними немає жодного зв'язку.
Один із перших принципів дає нам правило множення: якщо у вас ймовірності незалежні, то ймовірність відразу двох цих подій дорівнюватиме добутку їх ймовірностей. Це не спрацює, якщо події пов'язані. Наприклад, страховка побудована тому, що у ідеалі страхова компанія продає поліси на незалежні події (чи страхує життя незалежних один від одного людей). Тому маштабна пожежа – поганий приклад страхового випадку.
Якщо хтось у квартирі залишив увімкнену праску, а потім спалахнула вся квартира, інші будинки від цього не згорять, вони від цієї неприємної події ніяк не залежать. І тут ймовірність того, що згорить все місто, дуже мала. Адже ймовірність того, що згорять будинок А, будинок B та будинок С, дорівнює добутку ймовірностей пожежі в них. Якщо вона дорівнює одній тисячній, а в місті 1000 будинків, то ймовірність того, що всі вони згорять, дорівнює 1/1000000, це хоча і не нуль, але можна вважати, що нуль. Тому, якщо виписати дуже багато незалежних полісів, то ризику розоритися у страхової компанії практично немає. Це фундаментальна ідея, яка здається простою та очевидною, але вона абсолютно точно не була такою, коли з'явилася.
Математичне очікування
Ще одна важлива концепція, яку ми будемо розглядати, - це математичне очікування. Хтось може називати його середнім або найбільш очікуваним результатом — це терміни, що приблизно взаємозамінні. Можна їх трохи по-різному пояснювати залежно від того, чи говоримо ми про середнє з вибірки чи всієї сукупності подій.
Але спочатку треба зрозуміти, що таке випадкова величина. Якщо ми проводимо експеримент і результат експерименту якесь непередбачуване число, то наш експеримент видає випадкову величину. Ну, наприклад, якщо ми кидаємо монету і привласним решці 0, а орлу - 1, тоді ми й визначили випадкову величину.
Існують дискретні (тобто переривчасті) випадкові змінні, на кшталт тієї, що я щойно навів у приклад, — у неї можуть бути лише конкретні значення. Коли ми маємо справу з випадковими, але цілком певними подіями в ідеальних умовах (як, наприклад, підкидання абсолютно чесної монети), ймовірність події – це кількість потрібних нам результатів, поділена на кількість усіх можливих наслідків. Так, двічі кинувши монету, ми отримаємо ймовірність випадання потрібних нам двох рішок у вигляді 1/4, тому що результатів у нас чотири (решка-решка, решка-орел, орел-решка і два орли) - і всі вони мають однакові шанси .
Є ще безперервні випадкові величини, які на певному відрізку можуть набувати будь-якого значення. Ну ось візьмемо ми, змішаємо гарячий чай і холодну горілку і опустимо туди термометр. До речі, його теж винайшли в 17-му столітті, і тоді концепцію температури — для нас звичну і зрозумілу — тільки-но почали застосовувати. Ви вже здогадалися, що в нашій склянці з чарівним чаєм температура – величина безперервна, у неї необмежена кількість можливих значень, хоча мінімальну та максимальну ми уявляємо непогано.
Для дискретних випадкових змінних математичне очікування можна позначити грецькою літерою μ (мю), і воно буде сумою всіх результатів, помножених на ймовірність кожного з них.
У ВИПАДКУ ПІДКИДАННЯ НАШОЇ УМОВНОЇ МОНЕТИ МАТЕМАТИЧНЕ СПОДІВАННЯ БУДЕ РІВНО 1/2, І РЕЗУЛЬТАТА ТІЛЬКИ ДВА.
А взагалі, звісно, їх може бути будь-яке число, зокрема й нескінченне. Але їх можна порахувати і дізнатися про середньозважену оцінку, а вона і називається математичним сподіванням. Також його називають середнім арифметичним. Але, щоб його порахувати, ми повинні знати точні ймовірності.
Для більшої ясності візьмемо звичайний шестигранний кубик. Очевидно, що ймовірність випадання кожної цифри одна шоста. Сума всіх випадень — 1+2+3+4+5+6 = 21. Беремо від кожної одну шосту, складаємо разом (або просто 21 ділимо на 6), отримуємо три з половиною. Значить, математичне сподівання кидка кубика - 3.5. Якщо ми багато разів кинемо кубик і порахуємо середнє, то вийде число, близьке до 3.5. Зрозуміло, що у разі кидка одного кубика чекати 3.5 безглуздо, а от у разі двох чекати на сімку — дуже хороша ідея.
Крім середнього ще є медіана — це коли половина результатів експерименту більша, а половина менша за цю цифру. Вона часто використовується в демографії — зарплату по регіонах коректніше порівнювати не середню, а медіанну, бо дуже маленькі чи дуже великі зарплати спотворюють реальну картину. А на медіану вони не впливають.
Якщо нам потрібне математичне сподівання безперервних функцій, то ідея там точно така ж, але складати треба інтеграли. Слово страшне (сам його боюся), але взагалі це просто сума площ під графіком функції. Наприклад, взяти температуру - ймовірність того, що термометр покаже в окропі рівно 100 градусів, дорівнює нулю (майже), тому що він завжди може показати 100.001 або 99.999. Таких цифр нескінченна кількість, і кожна конкретна їх ймовірність дорівнює нулю (майже). Але можна подивитися, наприклад, щільність ймовірності в будь-якого відрізка.
Генеральна сукупність проти вибірки
Тепер кілька слів про сукупність. Ми вимірювали ознаки всіх можливих варіантів випадання кубика і добре все порахували. Але насправді результати експериментів порахувати важко, тому що ми набагато частіше маємо справу з вибірками, а не з усією сукупністю результатів. Візьмемо, наприклад, дерево. Хочемо оцінити кількість його листя, беремо 5 гілок і вважаємо на них середню кількість листя. Потім множимо їх на кількість гілок, і у нас вийде приблизна (але непогана) оцінка кількості листя на дереві.
Отже, реальну середню кількість листя на гілці ми не знаємо, а лише приблизно визначили з п'яти наших гілок. Його прийнято позначати не іксом, а іксом з рисою, і воно тим ближче до иксу, чим ближче кількість відібраних нами гілок до кількості гілок по всьому дереву. Якщо ми візьмемо кілька гілок (а не тільки найдовші, наприклад), то наша вибірка буде краще відображати властивості всього дерева. Так і з людьми — якщо в досліджуваній групі є представники різних міст, професій, вікових груп, то висновки будуть точнішими, ніж якщо опитати лише вічно п'яних студентів фізмату.
В Америці був цікавий казус із репрезентативністю вибірки, коли журнал «Літерарі Дайджест» опитав аж 10 мільйонів людей щодо виборів президента. Це безліч респондентів: для достовірної статистики вистачило б 2–3 тисячі правильно зібраних відповідей. Журнал передбачив перемогу республіканцю Альфу Лендону зі значною перевагою (60 на 40), а вибори виграв демократ Франклін Рузвельт — якраз із такою самою перевагою, але у протилежний бік. Справа в тому, що більшість передплатників журналу були республіканцями, а в спробі згладити цю невідповідність журнал розсилав бюлетені телефонними книгами. Але не врахував кумедного факту: телефони тоді були доступні лише середньому та вищому класу суспільства, а це були переважно республіканці.
Дисперсія
Поки що ми говорили лише про засоби виміру основної тенденції, але ще нам знадобиться засіб виміру її варіативності, інакше кажучи, розкид її значень. Дисперсія випадкової величини - це як вона змінюється від одного виміру до іншого. Позначається вона як σ^2, грецька сигма у квадраті. А просто сигма це так зване стандартне відхилення. Це корінь із дисперсії.
Дисперсія - це сума квадратів відстаней від кожного результату до середнього, поділена на кількість цих результатів. Тут погано те, що вона розмірністю не збігається з явищем, що вивчається. Якщо ми вимірюємо сантиметри, то дисперсія опиниться у квадратних сантиметрах. Тож із неї беруть корінь. Щоб не луснув мозок, згадаємо про кубик, тож для шестигранника дисперсія виходить 2.92 (самі порахуєте? я вам допоможу (1 – 3.5)^2 + (2 – 3.5)^2 + (3 – 3.5)^2 + (4 – 3.5)^2 + (5 – 3.5)^2 + (6 – 3.5)^2 = 17.5, ділимо на 6 = 2.917), ну а корінь із цього — 1.71. Тобто в середньому у нас випадає 3.5, але розкид результатів від середнього дорівнює 1.71. Чим більший цей розкид, тим більше квадрати відстаней до середнього, тим більше дисперсія, тим сильніша наша випадкова величина варіюється.
Оцінювати дисперсію всієї сукупності за вибіркою не зовсім правильно. Повертаючись до нашого прикладу з деревом, розкид між кількістю листя у вибраних нами гілок буде, природно, меншим, ніж у всіх гілок дерева. Тому, щоб дізнатися дисперсію всієї сукупності, її ділять не на n результатів, а на n-1, це називається корекція усунення, придумав її у 19-му столітті Фрідріх Бессель, учень Гаусса.
Розподіл хвостів
Ми часто приймаємо як даність, що безліч величин у світі розподілено за нормальним законом. Але я хочу наголосити на тому, що є й інші розподіли. Із так званими товстими хвостами. Хвостами, Карл!
У нормальному розподілі події, що відхиляються від середнього значення на п'ять і більше стандартних відхилень, зустрічаються вкрай рідко, а з 10 або більше сигмами практично неможливі. Приклад розподілу "з товстими хвостами", що має "нескінченну сигму", - розподіл Коші. Головна його особливість для нас — складність прогнозування подій. Причому справа не лише в самій складності, а й у нашому дуже віддаленому розумінні рівня цієї складності.
ЛЮДИНІ НЕ ВЛАСТИВО ДУМАТИ ІМОВІРНІСНИМИ КАТЕГОРІЯМИ, І ВОНА НЕ МОЖЕ ОЦІНИТИ НАВІТЬ СКЛАДНІСТЬ НАЯВНОГО ПЕРЕД НЕЮ ЗАВДАННЯ.
Негативні події реального світу - теракти, банкрутства, заколоти та повстання - математично непередбачувані, вони й складають ці страшні товсті хвости. Вам здається, що ви розумієте, як працює система, але потім раптово відбувається щось разюче, чого ви ніколи не бачили. Людина ніколи не може бути достатньо досвідченою, щоб очікувати деякі речі. Це дуже ускладнює будь які прогнози.
Кубики кидаються, ймовірність міняєсь
Розповім ще про одне завдання, зовсім нещодавно його зустрів, і воно мене зацікавило своєю провокацією на помилку. Уявіть, що вам пропонують парі: кинути два кубики, і якщо на них випали лише 1, 2, 3 чи 4, тоді ви виграли. Але якщо там є 5 чи 6, тоді ви програли. Вам пропонують поставити на такий експеримент 10 доларів. Чи погоджуватися чи ні?
Дуже багатьом здається: ну як же так, зрозуміло, що 5 і 6 випадає вдвічі рідше, ніж 1, 2, 3 і 4. П'ять і шість всього в 1/3 випадків, а 1, 2, 3, 4 - в 2/3 випадків. Звісно, треба погоджуватися. У чому тут каверза?
Справа в тому, що достатньо лише однієї п'ятірки або шістки із двох кубів, щоб програти парі. Усього у кидка двох кісток 6*6 = 36 результатів, але для виграшу нам підходить тільки 16 з них: коли на першому кубику випадає 1, 2, 3, 4 і на другому теж одна з цих цифр. Якщо всі можливі наслідки подати у вигляді таблиці 6 на 6, вийде, що п'ятірка і шістка з другого кубика псує цілий ряд 1-2-3-4 першого кубика, і навпаки.
Виходить, що шанси того, що з двох кубів випаде одна п'ятірка або шістка, такі ж, як і що не випаде, - 16 варіантів. Але є ще 4 варіанти, коли на обох кубиках випадають тільки п'ятірки і шістки. У результаті виходить, що виграємо ми у 16 випадках із 36, а програємо – у 20. Імовірність виграти таке парі – 4/9, або близько 44 %, а програти – 5/9 – близько 56 відсотків.
Порахуємо математичне очікування при ставці в 10 доларів: +$10 * 4/9 - $10 * 5/9 = -$1.11, мінус долар із гривеньником та центом зверху.
Тож тепер вас таким парі не обдурити!
Парадокс дня народження
У цьому завданні я не буду нікого змушувати рахувати, просто хочу розповісти про поширену оману. Парадокс дня народження полягає в тому, що у групі з 23 осіб ймовірність того, що у двох людей збігатимуться дні народження, становить понад 50 відсотків. Тобто, якщо довкола 22 особи (або більше), можна сміливо робити ставку на те, що у когось із вас дні народження співпадуть.
ЧОМУ НАМ ВАЖКО В ЦЕ ПОВІРИТИ? ВІДПОВІДЬ МАТЕМАТИЧНА: СТЕПЕНІ ВАЖКО УСВІДОМИТИ.
Як імператор у стародавньому завданні про шахи та зернятка, ми і зараз погано розуміємо степеневу функцію. Навіть якщо ми навчилися математики, це все одно якось незвично. Ось приклад неправильної логіки: яка ймовірність випадання 10-ти рішок поспіль? Нетренований мозок може скласти приблизно такий ланцюжок думок: одна решка - це 50%. Дві рішки викинути вдвічі важче, це 25%. Ну а десять решок — у 10 разів важче, тобто 5%. Ну ось ми й обісрались. Реальний шанс — це 1/2 в 10-му степені, тобто 1/1024, тобто трохи менше десятої частки відсотка. Помилились трохи, в 50 разів.
Але навіть після навчання ми обманюємося. Ймовірність збігу днів народження двох осіб у будь-який день року (1/365 = 0,27%), помножена на кількість осіб у групі з 23, дає лише 23/365 = 6,3%. Це міркування неправильно, оскільки кількість можливих пар (а їх цілих 253) значно перевищує кількість осіб у групі.
Справа в тому, що люди егоїстичні. Ми часто не думаємо про оточуючих. І справді, чого про них думати? У кімнаті, де знаходяться 23 особи, ви напевно думаєте про те, що саме ваш день народження має збігтися з кимось із інших. Але ви навряд чи подумаєте про те, що є 230 порівнянь між іншими учасниками експерименту. Вам навіть не спало на думку, що порівнянь, які вас не стосуються, у 10 разів більше. І питання про те, чи збігатимуться дні народження у когось, підмінився в мозку на питання про те, чи збігатимуться дні народження у обраної людини з кимось іншим із групи. І тут ймовірність збігу, звісно, помітно нижча.
Начебто неважко перерахувати всі поєднання і перевірити, але є складність: може виявитися, що буде 2, 3 або всі 23 збіги. Це питання схоже на інше: яка ймовірність викинути хоча б одну решку за 23 кидки? Варіантів багато: решка на перший раз, на третій, або на п'ятий та десятий, або на другий та двадцять другий. Як вирішити таке завдання? Перевернути!
Замість рахувати кожен спосіб викинути решку, ми вважаємо ймовірність випадання невдалого сценарію, коли випадають лише орли. Імовірність цього — 1/2 23-го степеня, дуже невелика. Але важливо зрозуміти схему: якщо існує, наприклад, лише 1% ймовірність викинути всі орли, буде 99% шанс того, що випаде хоча б одна решка. Ми не знаємо — одна, дві, десять, чи п'ятнадцять, чи всі 23. Але якщо ми віднімемо ймовірність невідповідного сценарію з одиниці, у нас якраз залишиться ймовірність потрібного нам сценарію.
Той самий принцип можна застосувати і в завданні про дні народження. Замість шукати ймовірність збігу, набагато простіше знайти ймовірність того, що всі народилися в різні дні. Потім ми віднімемо цю цифру з одиниці і отримаємо ймовірність того, що є хоча б один збіг — хоч і не знатимемо, скільки саме їх буде, але нам це не потрібно. У нашому випадку треба помножити 364/365 на 363/365, продовжити 22 рази і відняти добуток від одиниці. Вийде 50.73%, тобто більше половини.
До речі, для 60 і більше осіб ймовірність такого збігу перевищує 99%, хоча (сподіваюся, це очевидно) 100% вона досягає, лише коли в групі буде не менше 367 осіб — з урахуванням високосних років.
Гра «вгадай думки сусідів»
Від учасників потрібно вгадати 2/3 від середньої кількості, загаданої всіма гравцями в кімнаті (в діапазоні від 0 до 100). Усі пишуть на папірці числа, ми їх складаємо, ділимо на кількість учасників та беремо 2/3 від середнього. Перемагає той, хто написав на своєму папірці найближче до знайденого число.
Пошук рівноваги Неша у цій грі призводить до цікавого феномену. Рівновага шукається шляхом відсіювання домінованих стратегій. Так, числа більше 66 домінуються будь-яким гравцем, тому що 2/3 навіть від 100 (якщо взагалі всі гравці написали на папірці 100) менше 67. Їх можна виключити. Як тільки всі гравці використовували цю стратегію, можна вимикати числа більше 44, адже тоді вже ніхто не запише цифру більше 66, а 2/3 від 66 приблизно 44.5.
Цей процес триває доти, доки всі цифри вище нуля не будуть виключені шляхом ітерації алгоритму. Але чи всі гравці керуватимуться здоровим глуздом? Навіть студенти магістратури із фінансів не назвуть нуль. Серед звичайних людей переможець зазвичай називає цифру набагато вищою: наприклад, у конкурсі датської газети «Politiken» із призом у 5000 крон брало участь 19 196 людей.
Середнє число було 21.6 — отже, у досить великій компанії сміливо можете називати 22 і будете близькі до перемоги. Гра ілюструє відмінність між раціональністю самого гравця та його поняттям про раціональність інших. Навіть абсолютно раціональні гравці не будуть називати цифру 0, якщо вони не знають точно, що інші гравці абсолютно раціональні.
До чого тут теорія ймовірності? Нідочого. Це приклад який показує, що коли вона стає молотком, все здається цв’яхами.
Зважування ймовірностей та парадокс алле-оп
Люди схильні спотворювати ймовірності у себе в мозку. Справа не в тому, що ми не знаємо ймовірність будь-яких подій, а в тому, що навіть коли ми їх точно знаємо, ми їх зважуємо неправильно.
Приклад візьмемо від француза Моріса Алле (оп!), прославився тим, що писав свої роботи виключно французькою, а на англійську мову він болт поклав.
Алле навів парадоксальний приклад людського рішення і назвав його своїм ім'ям (ну а яким ж ще?). Парадокс ілюструє спосіб мислення, що перевертає теорію очікуваної корисності. Я наведу спрощений варіант, насправді у француза була складніша конструкція з двох одночасних парі, але суть та ж.
Отже, випробуваному пропонують вибір між двома «перспективами». Наприклад, виграти $3000 із ймовірністю 25 % або $4000 із ймовірністю 20 %. Математичне очікування першої угоди — 750 доларів (ми тут вивченням теорії ймовірності займаємося, якщо ти не помітив). Другий – 800 доларів. Тут усі оберуть другу. Але не тому, що в неї більше математичне очікування — про це мало хто замислиться! Просто у нас в голові між 20% і 25% різниці немає, а ось між $3000 і $4000 різниця дуже суттєва.
Потім вводимо невелику варіацію, дуже просту. Помножимо обидві ймовірності на 4. Їхнє співвідношення ніяк не змінюється: маточікування виграшу в обох випадках просто збільшується в 4 рази. Цього разу вибір такий: виграти $3000 із ймовірністю 100 % (маточікування +$3000) або $4000 із ймовірністю 80 % (маточікування +$3200). І ось тут виявляється, що жодна людина не наважується вибрати другий варіант, хоча математично він вигідніший.
Чому ми вибираємо $4000 у першому парі та $3000 у другому? Співвідношення виграшів однакові, пропорційно збільшилася лише ймовірність. Очікувана корисність у них не повинна відрізнятися, адже теоретично не може бути такого, що раціональна людина обирає другий варіант у першому парі і одночасно перший варіант у другому. Але на практиці все навпаки. Через що відбувається перемикання?
Справа в тому, що очікуваний біль від 20% ймовірності програшу дуже великий.
МИ ВИКЛЮЧАЄМО АЗАРТ ПРИ НАЙМЕНШІЙ МОЖЛИВОСТІ. ТОМУ ЩО ЛЮДИ ОБИРАЮТЬ ВИЗНАЧЕННІСТЬ. ТРИВОГА НАМ НЕ ПОДОБАЄТЬСЯ — ДО НЕЇ ВАЖКО ПРИСТОСУВАТИСЯ.
Канеман і Тверськи писали про це так, що ми все ще печерні люди. За життя начебто всі вміють рахувати, та ось біда — ніхто нічого не рахує. Є байка, що у печерних людей було лише три цифри: одна, дві та багато. Хоча начебто в якихось мовах досі так і є. Так ось, емоційно ми все ще такі самі. Наче питаєш у багатодітної матусі з далекого амазонського племені: Скільки у тебе дітей? А слова "три" у неї немає. І якщо дітей більше двох, то їх просто багато.
Коли йдеться про наші оцінки ймовірності, ми схожі на цих печерних людей: поняття про ймовірність у нас спотворене. Між 20% і 25% для нас жодної різниці немає, а між 98% і 100% або між 0% і 2% різниця колосальна, не кажучи вже про 80% і 100%. Бажаєте отримати мільйон із ймовірністю 98 % чи сімсот тисяч із ймовірністю 100%? У першого парі матиматичне очікування — $980 000, у другого — $700 000. Різниця майже в півтора рази. Але 98%? Ні дякую. Можна збожеволіти від невдачі.
З'ясовується, що для звичайної не надто розумної людини емоційної різниці між 20% і 25% немає. Гроші різні, а можливість їх отримати звучить як однакова. Наче у нас тільки три дискретні ймовірності: не може статися, може статися і точно станеться. Межам діапазону ми надаємо значно більшого значення, ніж середині.
За старою теорією корисності, раціональна людина бере до уваги матиматичне очікування і робить усвідомлений вибір. За Канеманом (і по правді) цілком раціональні люди ведуть себе не цілком адекватно: якщо у цих ліків 0.1% смертельних побочок, а у цього — 0%, але більше легких і середніх, то раптово середні та легкі ускладнення перестають грати для нас якусь роль. Тому що впевненості (в даному випадку - безумовно не помремо) ми надаємо куди більшої ваги, а зовсім не підраховуємо в думці матиматичне очікування різних результатів.
Епілог
Ах, про ідіотів ще не було згадано. 95% — інтервал з двох середньоквадратичних відхилень нормально розподіленої випадкової величини. Тому якщо взяти декілька дискретних значень, що характеризують ідіотизм серед населення, вирахувати їхнє математичне очікування, дисперсію й середньоквадратичне відхилення, а потім взяти інтервал у двох середньоквадратичних відхилень навколо мат. очікування, то у цей інтервал потрапить 95% результатів дослідження.
Де це все використовувати? На це запитання ви маєте знайти відповідь самостійно. Я займаюсь лише написанням цікавого матеріалу. А ви, хоча б раз, зробіть домашнє завдання без генеративного ШІ, а самостійно.
Доречі, я знаю що ви не будете робити ДЗ самостійно. Адже у вас гарні оцінки з математики! Просто повторюй за мною: “Хто молодець? Я молодець! Хто молодець? Я молодець!”. І все буде добре.
НЕ ЗНАЮ, ЧИ ЗАХОТІЛОСЯ ВАМ ВИВЧАТИ ТЕОРІЮ ЙМОВІРНОСТІ ПІСЛЯ ПРОЧИТАНОГО. СПОДІВАЮСЬ, ЩО НІ ;) КРАЩЕ Б ВИ ЦЕГЛИ КЛАСТИ НАВЧИЛИСЯ. ЛЮДЯМ ЖИТИ НІДЕ!
Але якщо ви хоч трохи щось зрозуміли, то й добре.
Можна за це випити. Я вже.
Примітки
Див. також
|