Распределение Гаусса. Центральная предельная теорема теории вероятностей. Распределения Пирсона и Стьюдента
Распределение Гаусса. Центральная предельная теорема
теории вероятностей. Распределения Пирсона и Стьюдента.
С.В. Усатиков, кандидат физ-мат наук, доцент; С.П.
Грушевский, кандидат физ-мат наук, доцент; М.М. Кириченко, кандидат
социологических наук
Впервые
нормальный закон был обнаружен в Х1Х веке в применении к теории ошибок
измерения Лапласом и Гаусcом. Сейчас, после доказанной Ляпуповым центральной
предельной теоремы, стало уже ясным, почему этот нормальный закон широко
распространен в технике, биологии, социологии, психологии и многих других
сферах человеческих знаний. Все его содержание показано на рисунке 1, на
графике плотности распределения вероятностей.
Рис.1
Рис.1
Плотность распределения вероятностей нормального закона
1,2
- графики с одним средним m и разными стандартными отклонениями s , причем s
1<s 2
3
- график при m =0, s =1 для Z - закона и примерным распределением площадей под
кривой.
Под
аргументом x здесь можно понимать самые различные числовые величины, не
поддающиеся предсказанию до проведения эксперимента: рост, вес, число ошибок
при тестировании, умственное развитие, склонность к правонарушениям и любые
другие, возникающие как результат сложения многих независимых (или слабо
зависимых) и сравнимых по порядку своего влияния случайных воздействий. Функция
f(x) показывает следующую важнейшую информацию: вероятность числовой величине х
принять значение больше числа а и меньше числа в равна площади под кривой f(x)
на отрезке [ a,b] (рис.1). Разумеется, это касается любых a и b, близких между
собой или далеких, расположенных в любом месте прямой х. Кроме того, площадь
под всей кривой f(x) равна 1, т.е. вероятность для х попасть на прямую равна 1,
и это событие достоверное (это свойство еще называется условием нормировки).
У
нормального закона два параметра, полностью его определяющих: числа m и s .
Число m есть средняя величина для интересующих нас числовых показателей:
средний рост, средний вес и т.п. Меняя m , можно т совершать параллельный
перенос кривой f(x) вдоль оси х. Видно также, что наиболее вероятно появление
числа х в эксперименте вблизи m : площадь под f(x)на любом отрезке, содержащем
m, самая большая.
Число
s есть среднее отклонение числового показателя х от числа m: чем меньше s , тем
“круче” становится “холм” f(x) (рис.1) и тем меньше вероятность для х сильно
отличаться от m. Наоборот, при больших s “холм” f(x) растекается по “равнине” и
с почти равной вероятностью х может появиться как вблизи m , так и сколь угодно
далеко от m.
Если
числовой показатель х пересчитать в число Z по следующему правилу:
то
все “холмы” f(x) превратятся в кривую 3 закона Z Гаусса на рис.1. Тогда все
точки ± 1 для Z соответствует точкам m± s для х, а точки ± 3 для Z - точкам m±
3s для х. По распределению площадей под кривой 3 видно, что на отрезке [ -3,3]
сосредоточено примерно 99,7% всей площади под кривой f(x). Отсюда вытекает так
называемое правило “трех s “ для закона Z: с вероятностью р=0,997 случайная
величина х отклоняется от то все “холмы” f(x) превратятся в кривую 3 закона Z
на рис.1. Тогда все точки ± 1 средней m (влево или вправо) не более чем на 3s .
Теперь
настал момент объяснить, почему так много внимания уделяется “холму” f(x) на
рис.1. В теории вероятностей доказана теорема, совершенно справедливо названная
центральной предельной теоремой. В грубых чертах, сумма большого числа
(практически более 7 - 10) независимых случайных величин, сравнимых по порядку
своего влияния на рассеивание суммы, подчиняется нормальному закону. Например,
рост человека, на который оказывают влияние очень много факторов, среди которых
в массе нет доминирующих по своему влиянию.
С
начала ХХ века оказался очень полезным введенный Пирсоном закон c 2 (рис.2): в
страховом деле, в выяснении торгового спроса или популярности политиков и т.п.
Рис.2.
Плотность распределения вероятностей законаc 2, с n степенями свободы.
Под
аргументом х здесь понимается сумма n независимых слагаемых в квадрате, каждое
из которых подчиняется нормальному Z- закону с m =0 и s =1. Ясно, что при
больших n (практически при n >30) закон c 2 превращается в нормальный закон
с m = n и s =, поскольку
действует теорема Ляпунова. Но чаще всего слагаемых не более 10. Число n
называеся числом степеней свободы. Смысл f(x) такой же, как и в нормальном
законе: вероятность числовой величине х=c 2 попасть в заданный диапазон равна
площади под кривой f(x). Так, площадь под кривой на отрезке от 0 до n + составляет более 90% всей
площади под всей кривой f(x). Отсюда следут правило “трех s “ для закона c 2: с
вероятностью рі 0,9 случайная величина х=c 2 не превосходит величины n +Ц 2n
(очевидно, c 2 не может быть отрицательным).
Наконец,
необходимо упомянуть закон t Стьюдента, полученный из нормального закона и
законаc 2. Случайная величина t получается из дроби в числителе которой стоит
случайная величина Z Гаусса с m=0 и s =1, а в знаменателе - случайная величина
c 2 с n степенями свободы. По -прежнему при больших n закон Стьюдента переходит
в нормальный закон (практически при n і 30). Но даже при небольших n вид кривой
плотности распределения вероятностей для t очень похож на кривую 3 рис.1.
Разница в том, что вместо s =1 для Z необходимо брать s =n /(n -2), т.е.среднее
отклонение t от m=0 больше, чем среднее отклонение Z от m=0. Соответственно
“холм” закона t более пологий, чем “холм” закона Z.
Для
подготовки данной работы были использованы материалы с сайта http://mschool.kubsu.ru