Оценивание параметров и проверка гипотез о нормальном распределении
Оценивание параметров и проверка гипотез о нормальном
распределении
Расчетная работа
Выполнил Шеломанов Р.Б.
Кафедра математической статистики и эконометрики
Московский государственный университет экономики,
статистики и информатики
Москва 1999
ЗАДАНИЕ № 23
Продолжительность
горения электролампочек (ч) следующая:
750
|
750
|
756
|
769
|
757
|
767
|
760
|
743
|
745
|
759
|
750
|
750
|
739
|
751
|
746
|
758
|
750
|
758
|
753
|
747
|
751
|
762
|
748
|
750
|
752
|
763
|
739
|
744
|
764
|
755
|
751
|
750
|
733
|
752
|
750
|
763
|
749
|
754
|
745
|
747
|
762
|
751
|
738
|
766
|
757
|
769
|
739
|
746
|
750
|
753
|
738
|
735
|
760
|
738
|
747
|
752
|
747
|
750
|
746
|
748
|
742
|
742
|
751
|
752
|
762
|
740
|
753
|
758
|
754
|
737
|
743
|
748
|
747
|
754
|
754
|
750
|
753
|
754
|
760
|
740
|
756
|
741
|
752
|
747
|
749
|
745
|
757
|
755
|
764
|
756
|
764
|
751
|
759
|
754
|
745
|
752
|
755
|
765
|
762
|
По выборочным данным,
представленным в заданиях №1-30, требуется:
1* Построить
интервальный вариационный ряд распределения;
Построение
интервального вариационного ряда распределения
Max:
769
Min:
733
R=769-733=36
H=
R / 1+3,32 lg n=36/(1+3,32lg100)=4,712
A1= x min -
h/2=730,644
B1=A1+h; B2=A2+h
2* Вычислить выборочные
характеристики по вариационному ряду:
среднюю арифметическую (x
ср.), центральные моменты (мю к, к=1,4), дисперсию (S^2), среднее
квадратическое отклонение (S), коэффициенты асимметрии (Ас) и эксцесса (Ек),
медиану (Ме), моду (Мо), коэффициент вариации(Vs);
Вычисление
выборочных характеристик распределения
Di=(xi- xср)
xср =å xi mi/å mi
xср =
751,7539
Вспомогательная таблица ко второму пункту расчетов
Выборочный
центральный момент К-го порядка равен
M k
= ( xi - x)^k mi/ mi
В нашем примере:
Центр момент 1
|
0,00
|
Центр момент 2
|
63,94
|
Центр момент 3
|
-2,85
|
Центр момент 4
|
12123,03
|
Выборочная дисперсия S^2
равна центральному моменту второго
порядка:
В нашем примере:
S^2= 63,94
В нашем примере:
S= 7,996
Выборочные коэффициенты
асимметрии Ас и эксцесса Fk по формулам
Ac = m3/ S^3;
В нашем примере:
Ас =-0,00557
Ek = m4/ S^4 -3;
В нашем примере:
Ek = -0,03442
Медиана Ме -
значение признака x (e), приходящееся на середину ранжированного ряда
наблюдений ( n = 2l -1). При четном числе наблюдений( n= 2l)
медианой Ме является средняя арифметическая двух значений, расположенных в
середине ранжированного ряда: Me=( x(e) + x( e+1)
/2
Если исходить из
интервального ряда, то медиану следует вычислять по ормуле
Me= a me +h * (
n/2 - mh( me-1) / m me
где mе- означает номер
медианного интервала, ( mе -1) - интервала, редшествующего медианому.
В нашем примере:
Me=751,646
Мода Мо для
совокупности наблюдений равна тому значению признака , которому соответствует
наибольшая частота.
Для одномодального
интервального ряда вычисление моды можно производить по формуле
Mo= a mo + h * ( m mo- m(mo-1))/2 m mo- m(
mo-1) - m( mo+1)
где мо означает номер
модального интервала ( интервала с наибольшей частотой), мо-1, мо+1- номера
предшествующего модальному и следующего за ним интервалов.
В нашем примере:
Mo =
751,49476
Так как Хср,
Mo Me почти
не отличаются друг от друга, есть основания предполагать теоретическое
распределение нормальным.
Коэффициент
вариации Vs = S/ x
* 100 %= 3.06%
В нашем примере:
Vs=
1,06%
3* Построить гистограмму,
полигон и кумуляту.
Графическое
изображение вариационных рядов
Для
визуального подбора теоретического распределения, а также выявления положения
среднего значения (x ср.) и характера рассеивания (S^2 и S)
вариационные ряды изображают графически.
Полигон и
кумулята применяются для изображения как дискретных, так и интервальных рядов,
гистограмма – для изображения только интервальных рядов. Для построения этих
графиков запишем вариационные ряды распределения (интервальный и дискретный)
относительных частот (частостей)
Wi=mi/n, накопленных относительных частот Whi и
найдем отношение Wi/h, заполнив таблицу 1.4.
Интервалы
xi Wi Whi Wi/h
Ai-bi
1 2 3 4 5
4,97-5,08 5,03 0,02 0.02 0,18
5,08-5,19 5,14 0,03 0,05 0,27
5,19-5,30 5,25 0.12 0,17 1,09
5,30-5,41 5,36 0,19 0,36 1,73
5,41-5,52 5,47 0,29 0,65 2,64
5,52-5,63 5,58 0,18 0,83 1,64
5,63-5,74 5,69 0,13 0,96 1,18
5,74-5,85 5,80 0,04 1,00 0,36
Для
построения гистограммы относительных частот (частостей) на оси абсцисс
откладываем частичные интервалы, на каждом из которых строим прямоугольник,
площадь которого равна относительной частоте Wi данного i-го
интервала. Тогда высота элементарного прямоугольника должна быть равна Wi/h,.
Следовательно, позади под гистограммой равна сумме всех носительных частот,
т.е. единице.
Из
гистограммы можно получить полигон того же распределения. Если середины верхних
оснований прямоугольников соединить отрезками прямой.
4* Сделать вывод о форме ряда
распределения по виду гистограммы и полигона, а также по значениям
коэффициентов Ас и Ек.
4 Анализ графиков и выводы
Гистограмма и
полигон являются аппроксимациями кривой плотности (дифференциальной функции)
теоретического распределения (генеральной совокупности). Поэтому по их виду
можно судить о гипотическом законе распределения.
Для
построения кумуляты дискретного ряда по оси абсцисс откладывают значения
признака xi, а по оси ординат – накопленные относительные частоты
Whi. Для интервального ряда по оси абсцисс откладывают
интервалы .
С кумулятой
сопоставляется график интегральной функции распределения F(x).
В нашем
примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля.
Коэффициент асимметрии оказался отрицательным (Ас=-0,005), что свидетельствует
о небольшой левосторонней асимметрии данного распределения. Эксцесс оказался
также отрицательным (Ек= -0,034). Это говорит о том, что кривая, изображающая
ряд распределения, по сравнению с нормальной, имеет несколько более плоскую
вершину. Гистограмма и полигон напоминают кривую нормального распределения
(рис.1.1 и 1.2.). Все это дает возможность выдвинуть гипотезу о том, что
распределение продолжительности горения электролампочек является нормальным.
Примечание:
Кумулята, гистронрамма и полигон находятся в приложениях к работе.
5* Рассчитать плотность и
интегральную функцию теоретического нормального распределения и построить эти
кривые на графиках гистограммы и кумуляты соответственно.
Расчет
теоретической нормальной кривой распределения
Приведем один
из способов расчета теоретического нормального распределения по двум найденным
выборочным характеристикам x и S эмпирического ряда.
При расчете
теоретических частот m^тi за оценку математического ожидания (мю) и среднего
квадратического отклонения G нормального закона распределения принимают значения
соответствующих выборочных характеристик x ср. и S,
т.е. (мю)=Xср.=
751,7539; G=S=7,99.
Теоретические
частоты находят по формуле: M^i=npi,
где n –
объем; Pi – величина попадания значения нормально
распределенной случайной величины в i-й интервал.
Вероятность Pi
определяется по формуле
Pi=P(ai<x<=bi)=1/2[Ф(t2i)-Ф(t1i)],
Где Ф(t)=2\
2(пи)=интегралу с границами от (0;t) е^x2/2dx
- интегральная функция Лапласа – находится по таблице для
T2i=bi-x ср.\
S
T1i=ai-x ср.\S
Таблицы Для вычисления вероятности нормальной кривой
распределения
Интервалы
|
Mi
|
T1
|
T2
|
1/2Ф(T1)
|
1/2Ф(T2)
|
Pi
|
b(i)
|
|
|
|
|
|
|
730,644
|
735,356
|
2
|
-2,640
|
-2,051
|
0,4958
|
0,4798
|
-0,0080
|
735,356
|
740,068
|
8
|
-2,051
|
-1,461
|
0,4798
|
0,4279
|
-0,0260
|
740,068
|
744,780
|
6
|
-1,461
|
-0,872
|
0,4279
|
0,3078
|
-0,0601
|
744,780
|
749,492
|
18
|
-0,872
|
-0,283
|
0,3078
|
1,1103
|
0,4013
|
749,492
|
754,204
|
35
|
-0,283
|
0,306
|
0,0300
|
0,6619
|
0,3160
|
754,204
|
758,916
|
12
|
0,306
|
0,896
|
0,1179
|
0,3133
|
0,0977
|
758,916
|
763,628
|
11
|
0,896
|
1,485
|
0,3133
|
0,4306
|
0,0587
|
763,628
|
768,340
|
6
|
1,485
|
2,074
|
0,4306
|
0,4808
|
0,0251
|
768,340
|
773,052
|
2
|
2,074
|
2,664
|
0,4960
|
0,0076
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Pi*n
|
Mi(теор)
|
Mi(теор)/h
|
Mi(теор)накоп
|
|
|
|
-0,8000
|
1
|
0,002
|
0,0080
|
|
|
|
|
-2,5950
|
3
|
0,006
|
0,0340
|
|
|
|
|
-6,0050
|
6
|
0,013
|
0,0940
|
|
|
|
|
40,1250
|
40
|
0,085
|
0,4953
|
|
|
|
|
31,5950
|
32
|
0,068
|
0,8153
|
|
|
|
|
9,7700
|
10
|
0,021
|
0,9130
|
|
|
|
|
5,8650
|
6
|
0,012
|
0,9716
|
|
|
|
|
2,5100
|
3
|
0,005
|
0,9967
|
|
|
|
|
0,7600
|
1
|
0,002
|
1,0000
|
|
|
|
|
|
100
|
|
|
|
|
|
|
Сравнение гистограммы и
нормальной кривой наглядно показывает согласованность между теоретическим и
эмпирическим распределением.
Примечание: Построенные
графики находятся в приложениях к работе.
6* Проверить гипотезу о
нормальном законе распределения по критерию согласи яПирсона f^2).
Проверка
гипотез о нормальном законе распределения
Частоты для проверки
соответствия эмпирического ряда распределения нормальному закону используют
критерий X^2, основанный на сравнении эмпирических частот mi с
теоретическими m^тi, которые можно ожидать при принятии определенной
нулевой гипотезы.
Значение X^2набл.
– наблюдаемое значение критерия, полученное по результатам наблюдений, равно
к
F^2набл.= (mi-m^тi)
I=1
m^i
Где к – число интервалов
(после объединения). M^i – теоретические частоты. Все вспомогательные расчеты,
необходимые для вычисления f^2, сведем в таблицу 1.6.
Таблица 1.6.
Вычисление критерия X^2
при проверке нормальности продолжительности горения электролампочек
Интервалы
|
Mi(Практ)
|
Mi(теор)
|
(Mi-Mi(теор))^2
|
…../Mi(теор)
|
a(i)
|
b(i)
|
|
|
|
|
730,644
|
735,356
|
2
|
2
|
9
|
1,29
|
735,356
|
740,068
|
5
|
|
|
740,068
|
744,780
|
6
|
13
|
49
|
3,88
|
744,780
|
749,492
|
18
|
21
|
9
|
0,43
|
749,492
|
754,204
|
35
|
25
|
100
|
4,01
|
754,204
|
758,916
|
12
|
21
|
81
|
3,89
|
758,916
|
763,628
|
11
|
12
|
1
|
0,08
|
763,628
|
768,340
|
6
|
5
|
1
|
0,14
|
768,340
|
773,052
|
2
|
2
|
|
|
|
|
|
|
X^2набл
|
13,71
|
Правило проверки гипотезы
заключается в следующем. Определяем по таблице распределения xu-квадрат критическое значение
X^2кр.(альфа для числа степеной свободы V=к-3
и заданного уровня значимости альфа.
Затем сравниваем X^2кр.
Если X^2 набл.<=X^2кр.
, то выдвинутая гипотеза о законе распределения не отвергается (не
противоречит опытным данным).
Если X^2 набл. >X^2кр.
, то выдвинутая гипотеза о нормальном законе распределения отвергается с
вероятностью ошибки a.
Для нашего примера X^2набл.=13,71,
a=0,005, V=7-3=4 (число интервалов после объединения стало
равным 7) и X^2кр. (0,005; 4) =14,9
Так как X^2набл.<X^2кр.,
то согласно критерию Пирсона гипотеза о нормальном законе не отвергается с
вероятностью ошибки 0,005. Можно сделать вывод, что распределение
продолжительности горения электролампочек является нормальным. Что
подтверждают графики и значения моды и медианы.
Список литературы
Для подготовки данной работы
были использованы материалы с сайта http://www.ed.vseved.ru/