Блог трейдера

«Подумаешь, бином Ньютона» © Мастер и Маргарита

# 26.05.2008 12:23

(из серии «Ликбез»)

В ходе обсуждения предыдущей заметки, мой оппонент высказал суждение, которое я не могу оставить без внимания:
Потому что теория вероятности...это такая наука (кстати, насколько я знаю, есть уважаемые на западе университеты, которые её даже не преподают),которая...ну вот она утверждает:
"отношение числа выпадания орлов к числу выпадания решек у правильной монетки будет стремиться к 1 в бесконечности", но ничего не может вякнуть про то с какого числа попыток это утверждение начнёт сбываться устойчиво.И таким образом, делает себя нелегитимной для использования в качестве законодательной базы.

То, что отношение к теории вероятностей среди тех, кто свято верит в постулат «Бог не играет в кости», мягко говоря, скептическое, это, в общем, не новость и в очередной раз открывать философскую дискуссию на эту тему у меня нет никакого желания. Но то, что теорию вероятностей не преподают в университетах, где уровень ее «знаний» преподавателями тот, что упомянут в кавычках в приведенной цитате, неудивительно: как можно преподавать то, что просто не знаешь?

Речь в кавычках идет об известной теореме теории вероятностей, получившей в общем виде название «закон больших чисел». Суть этого утверждения заключается в том, что при некоторых условиях, о которых мы поговорим ниже, сумма значений выборки с конечными матожиданиями (необязательно стационарной), деленная на N-число испытаний, стремится по вероятности к сумме средних, деленной на N при N стремящемся к бесконечности.

Для справки «стремление по вероятности» случайной величины s (а сумма значений выборки, деленная на N – случайная величина) к некоторому числу A означает, что для любого постоянного b вероятность события |s-A| больше b стремится к нулю.

Да, как мы видим, в самой формулировке закона больших чисел действительно нет никаких данных о скорости сходимости. Более того, этот закон выполняется далеко не для всех выборок. Например, рассмотрим следующую схему испытаний:
- на первом испытании бросается правильная монетка (т. е. монетка с равной вероятностью выпадения орла и решки);
- на всех последующих испытаниях монетка кладется вверх той же стороной, которой она выпала на первом испытании.

Матожидание числа орлов при таких «бросаниях» в точности совпадает с матожиданием числа «орлов» при независимых бросаниях (N/2), однако ни о какой сходимости по вероятности числа «орлов», деленного на N, к ½ при N стремящемся к бесконечности, не может быть и речи, так как при любом N число «орлов», деленное на N, имеет очень простое распределение р(1)=р(0)=½.

Этот пример наглядно показывает, что наличие конечного среднего не является достаточным условием выполнения закона больших чисел. Но теория вероятностей давно ответила на вопрос о необходимых и достаточных условиях выполнения этого закона в случае конечной дисперсии каждого испытания. Формулируются они достаточно просто:

Дисперсия суммы значений выборки с конечными матожиданиями и дисперсиями, деленная на N² стремится к нулю, при N стремящемся к бесконечности.

Да, мы вынуждены признать: полного описания зависимостей в испытаниях, для которых выполнялось бы приведенное условие, в теории вероятностей нет, но совершенно очевидно, что это условие выполняется для независимых испытаний с конечной дисперсией. Более того, в последнем случае известны и оценки скорости сходимости вероятности события |s-A| больше b к нулю. И самое интересное, что «эталоном» для этих оценок служит оценка, которая легко получается для случая независимого бросания одинаковой монетки. Почему? Да потому что это один из тех случаев, когда мы знаем точную формулу для вероятности числа «орлов» и выражается она через … бином Ньютона (см. заголовок). Действительно, если вероятность выпадения «орла» в каждом из испытаний равна р, то вероятность того, что число «орлов» в N испытаниях будет равно n равна:
Р(n)=C(N,n)*pⁿ*(1-p)^N-n,
C(N,n)=N!/(n!*(N-n)!) – число сочетаний из N по n, m!=1*2*…*m.

Из этой формулы при любых р и N для любого интервала [m,n], m и n – целые и m меньше либо равно n, легко получить вероятность непопадания числа «орлов» в этот интервал. Более того, просто решить и обратную задачу: задать маленькую вероятность альфа и найти интервал, вероятность попадания в который больше либо равна 1-альфа. Для примера рассчитаем эти вероятности для N=100, 1000, 10000, p=½, альфа=10^-5 и интервалов [45%,55%] и [40%,60%]

N	1-10^-5	меньше 45% и больше 55%	меньше 40% и больше 60%
100	[28%,72%]	0.2713	0.0569
1000	[42,7%,57,3%]	1.4*10^-3	1.8*10^-10
10000	[47,79%,52,21%]	меньше 10^-21	меньше 10^-86

Вот и судите сами о чем, например, говорит выпадание больше 600 «орлов» на 1000 испытаниях. Вероятность этого события при равновероятном и независимом бросании правильной монетки вообще-то 0.9*10^-10 (распределение симметрично).

Так уж на что на что, а на вопрос: «с какого числа попыток это утверждение начнёт сбываться устойчиво» для независимого бросания правильной монетки именно теория вероятностей и дает исчерпывающий ответ. Другой вопрос в том: закладываться или не закладываться на событие, вероятность появления которого очень мала, например, те же самые 10^-5, а число испытаний за все мыслимое время наблюдений не больше 10-20 (одним "испытанием" в данном случае мы подразумеваем выборку из N испытаний)? Могу ответить одно: если закладываться, то лучше «сидеть на печи и ничего не делать».

Предвижу возражение: «А откуда Вы знаете, что вероятность 10^-5? Конечно я этого не знаю. Но знаю другое: может быть одно из двух: либо вероятность 10^-5, либо монетка неправильная или(и) испытания зависимы. А второй случай, как говорится, «совсем другой компот» и тема для другой заметки.

А. Г.

постоянный адрес статьи

комментарии 11

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84