«Подумаешь, бином Ньютона» © Мастер и Маргарита 

# 26.05.2008 12:23
(из серии «Ликбез»)


В ходе обсуждения предыдущей заметки, мой оппонент высказал суждение, которое я не могу оставить без внимания:
Потому что теория вероятности...это такая наука (кстати, насколько я знаю, есть уважаемые на западе университеты, которые её даже не преподают),которая...ну вот она утверждает:
"отношение числа выпадания орлов к числу выпадания решек у правильной монетки будет стремиться к 1 в бесконечности", но ничего не может вякнуть про то с какого числа попыток это утверждение начнёт сбываться устойчиво.И таким образом, делает себя нелегитимной для использования в качестве законодательной базы.


То, что отношение к теории вероятностей среди тех, кто свято верит в постулат «Бог не играет в кости», мягко говоря, скептическое, это, в общем, не новость и в очередной раз открывать философскую дискуссию на эту тему у меня нет никакого желания. Но то, что теорию вероятностей не преподают в университетах, где уровень ее «знаний» преподавателями тот, что упомянут в кавычках в приведенной цитате, неудивительно: как можно преподавать то, что просто не знаешь?

Речь в кавычках идет об известной теореме теории вероятностей, получившей в общем виде название «закон больших чисел». Суть этого утверждения заключается в том, что при некоторых условиях, о которых мы поговорим ниже, сумма значений выборки с конечными матожиданиями (необязательно стационарной), деленная на N-число испытаний, стремится по вероятности к сумме средних, деленной на N при N стремящемся к бесконечности.

Для справки «стремление по вероятности» случайной величины s (а сумма значений выборки, деленная на N – случайная величина) к некоторому числу A означает, что для любого постоянного b вероятность события |s-A| больше b стремится к нулю.

Да, как мы видим, в самой формулировке закона больших чисел действительно нет никаких данных о скорости сходимости. Более того, этот закон выполняется далеко не для всех выборок. Например, рассмотрим следующую схему испытаний:
- на первом испытании бросается правильная монетка (т. е. монетка с равной вероятностью выпадения орла и решки);
- на всех последующих испытаниях монетка кладется вверх той же стороной, которой она выпала на первом испытании.

Матожидание числа орлов при таких «бросаниях» в точности совпадает с матожиданием числа «орлов» при независимых бросаниях (N/2), однако ни о какой сходимости по вероятности числа «орлов», деленного на N, к ½ при N стремящемся к бесконечности, не может быть и речи, так как при любом N число «орлов», деленное на N, имеет очень простое распределение р(1)=р(0)=½.

Этот пример наглядно показывает, что наличие конечного среднего не является достаточным условием выполнения закона больших чисел. Но теория вероятностей давно ответила на вопрос о необходимых и достаточных условиях выполнения этого закона в случае конечной дисперсии каждого испытания. Формулируются они достаточно просто:

Дисперсия суммы значений выборки с конечными матожиданиями и дисперсиями, деленная на N2 стремится к нулю, при N стремящемся к бесконечности.

Да, мы вынуждены признать: полного описания зависимостей в испытаниях, для которых выполнялось бы приведенное условие, в теории вероятностей нет, но совершенно очевидно, что это условие выполняется для независимых испытаний с конечной дисперсией. Более того, в последнем случае известны и оценки скорости сходимости вероятности события |s-A| больше b к нулю. И самое интересное, что «эталоном» для этих оценок служит оценка, которая легко получается для случая независимого бросания одинаковой монетки. Почему? Да потому что это один из тех случаев, когда мы знаем точную формулу для вероятности числа «орлов» и выражается она через … бином Ньютона (см. заголовок). Действительно, если вероятность выпадения «орла» в каждом из испытаний равна р, то вероятность того, что число «орлов» в N испытаниях будет равно n равна:
Р(n)=C(N,n)*pn*(1-p)N-n,
C(N,n)=N!/(n!*(N-n)!) – число сочетаний из N по n, m!=1*2*…*m.

Из этой формулы при любых р и N для любого интервала [m,n], m и n – целые и m меньше либо равно n, легко получить вероятность непопадания числа «орлов» в этот интервал. Более того, просто решить и обратную задачу: задать маленькую вероятность альфа и найти интервал, вероятность попадания в который больше либо равна 1-альфа. Для примера рассчитаем эти вероятности для N=100, 1000, 10000, p=½, альфа=10-5 и интервалов [45%,55%] и [40%,60%]
N1-10-5меньше 45% и больше 55%меньше 40% и больше 60%
100[28%,72%]0.27130.0569
1000[42,7%,57,3%]1.4*10-31.8*10-10
10000[47,79%,52,21%]меньше 10-21меньше 10-86

Вот и судите сами о чем, например, говорит выпадание больше 600 «орлов» на 1000 испытаниях. Вероятность этого события при равновероятном и независимом бросании правильной монетки вообще-то 0.9*10-10 (распределение симметрично).

Так уж на что на что, а на вопрос: «с какого числа попыток это утверждение начнёт сбываться устойчиво» для независимого бросания правильной монетки именно теория вероятностей и дает исчерпывающий ответ. Другой вопрос в том: закладываться или не закладываться на событие, вероятность появления которого очень мала, например, те же самые 10-5, а число испытаний за все мыслимое время наблюдений не больше 10-20 (одним "испытанием" в данном случае мы подразумеваем выборку из N испытаний)? Могу ответить одно: если закладываться, то лучше «сидеть на печи и ничего не делать».

Предвижу возражение: «А откуда Вы знаете, что вероятность 10-5? Конечно я этого не знаю. Но знаю другое: может быть одно из двух: либо вероятность 10-5, либо монетка неправильная или(и) испытания зависимы. А второй случай, как говорится, «совсем другой компот» и тема для другой заметки.

А. Г.


постоянный адрес статьи
комментарии 11
Он
Млин...ну давайте я соглашусь,что для Вас с Вашими знаниями предмета этот вопрос не является камнем преткновения и распишусь в том,что хотя в своё время я и имел по ТВ и МС в ВУЗе пятёрку,но сейчас не готов на Вашем уровне Вас опровергнуть.
Но ответите ли Вы мне КОНКРЕТНО и ТОЧНО-ЧИСЛЕННО на:
вот допустим мне предстоит бросить(неизвестно какую:правильной формы или неправильной) монетку неизвестно какое,но ТОЧНО КОНЕЧНОЕ число раз,после КАКОГО числа бросаний в случае,если у меня будет такое(КАКОЕ?) существенное преимущество выпавших скажем орлов над решками я должен буду сделать вывод,что имею дело с монеткой неправильной формы?(если вдруг Вы скажите,что я не задал уровень достоверности,то пусть он будет 0.95)

#26.05.08 13:03

А. Г.
Вы предлагаете мне добавить в таблицу столбец для альфа=0.05. Тогда задайте числа N, для которых считать. 100, 1000 и 10000 - достаточно?

А вывод при выходе за указанные интревалы я уже указал в предпоследнем абзаце заметки:

"монетка неправильная или(и) испытания зависимы."

Точнее, увы, в данной постановке задачи сказать невозможно.

#26.05.08 13:18

А. Г.
И в догонку: чем Вас не устраивают интрвалы, приведенные в первом столбце таблицы? Достоверность то там гораздо выше Ваших 0,95 - 1-10^-5=0.99999. В Вашем случае интервалы будут Уже.

#26.05.08 13:25

Он
...я пока не могу догнать(заклинило чего-то да и торговать надо) как Ваши раскладки согласуются с теоремой Пойа...
Пока вопросов нет.

ПС.Я не говорил,что ТВ не стоит пользоваться в трейдинге...я говорил,что не существует доказательств неэффективного рынка,т.к. аксиоматика ТВ построена на таких понятиях как "бесконечность","большие числа".

#26.05.08 14:27

А. Г.
По поводу аксиоматики ТВ Вы заблуждаетесь. Это все теоремы ТВ, а не аксиоматика. А аксиоматика ТВ в упрощенном виде звучит так: "единственное, что мы можем знать о будущем сегодня - это набор событий с некоторыми вероятностями их реализации".

#26.05.08 14:38

Он
Давайте сверимся...100 бросаний правильной монетки...требуется найти вероятность ровно 60 орлов или решек против 40 орлов или решек.

У меня:
(100!/60!*40!)*(0.5^60)*(0.5^40)=0.01
Правильно?У Вас сколько получается?

#27.05.08 22:50

А. Г.
Да, все верно. С бОльшей точностью получится
0.01084. Только не увлекайтесь вероятностями конкретного значения, а то придете к другому "парадоксу": при росте числа испытаний вероятность любого числа "орлов" стремится к нулю. На самом деле парадокса в этом нет. Но это из другой "оперы": аксиоматики дифференциального и интегрального исчисления. Поэтому с увеличением числа испытаний надо переходить к вероятностям попадания в некоторый интервал.

#28.05.08 09:45

Он
Блин...чёто эта заметка не канет в лету и глаз мне мозолит.....

Вообщем,вот это :

"Да, как мы видим, в самой формулировке закона больших чисел действительно нет никаких данных о скорости сходимости. Более того, этот закон выполняется далеко не для всех выборок. Например, рассмотрим следующую схему испытаний:
- на первом испытании бросается правильная монетка (т. е. монетка с равной вероятностью выпадения орла и решки);
- на всех последующих испытаниях монетка кладется вверх той же стороной, которой она выпала на первом испытании."

-это именно то,что и вогнало меня в ступор.Но даже по прошествии времени я так и не понял с какого бодуна что-то меняется,если со второго бросания монетку ложить всё время одной стороной.
---------------------------------------------

Ваши расчёты,с моей точки зрения,никак не решают ту задачу(вопрос),которую я озвучил.Хотя....если их взять в качестве отправной точки,то с соответствующими дополнениями(продолжениями)они меня натолкнули....вообщем,я выяснил для себя вопрос про теорему Пойа.
--------------------------------------------

"100 бросаний правильной монетки...требуется найти вероятность ровно 60 орлов или решек против 40 орлов или решек.

У меня:
(100!/60!*40!)*(0.5^60)*(0.5^40)=0.01 "

Здесь меня просто прикололо,что уже при 100 бросков вероятность события >60 выпавших орлов(либо решек) уже =0.0569....Ну просто не ожидал,что реализация профит-фактора 1.5 на СБ УЖЕ на 100 бросках с ТАКОЙ вероятностью...Полезно иногда всё же досчитывать до конкретных цифр общие формулы(это я для себя зарубку сделал).






#03.06.08 21:49

А. Г.
Извините, но подготовка к Конференции заняла время и было не до блога. Потому заметка и висит - нет новых тем. Может к концу недели будет новая заметка об аналогиях на нашем рынке и перспективах июня в рамках метода аналогий.

А в приведенном примере зависимых испытаний меняется очень многое: в таких испытаниях мы можем иметь только два исхода числа орлов - 0 и N с вероятностью 1/2 и ни о каком биноме Ньютона, как в случае независимых испытаний, не может быть и речи.

Это лишь один пример, но я даже больше скажу - все датчики случайных чисел (ДСЧ) представляют собой зависимые испытания, а не СБ, хотя и строятся таким образом, чтобы стандартные критерии не отличали их от СБ (неправда ли похоже на рынок?).

Правда, для ДСЧ также легко выписать вероятности, как в независимом случае, чаще всего, непросто и эта задача в большинстве случаев не решена.

#03.06.08 22:52

Он
Почему приведённый пример классифицируется как с зависимыми испытаниями?Вы в трясучку в детстве играли?Как не ложи монетку при последующем бросании,но если мы говорим,что она будет подброшена СЛУЧАЙНЫМ образом то и результат будет такой же.Тем более принимая во внимание то,что вы говорили о генераторах СБ(ДСБ) и с чем я согласен,т.к. сам давно и часто говорю,что искусственный(запрограммированный) ГСБ невозможен.


#04.06.08 13:57

А. Г.
Почему приведённый пример классифицируется как с зависимыми испытаниями?
==========================================
Потому что вероятность выпадения орла на t+1 шаге при условии, что на t-ом был орел - равна 1, а безусловная вероятность выпадения орла на t+1 шаге равна 1/2.

Независимость по определению - это когда условная и безусловная вероятности совпадают. А в данном примере они отличаются и сильно.

#04.06.08 15:23


Имя
Комментарий
внимание: html вырезается


Mosquito 1.1.96 b290308

Rambler's Top100