Распределение данных

  • Вид работы:
    Контрольная работа
  • Предмет:
    Математика
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    117,84 Кб
  • Опубликовано:
    2012-11-10
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Распределение данных

Задание 1

Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).

Лист2, столбец А

Статистическая задача.

Вычислить основные статистические характеристики распределения данных: объем наблюдений, среднее значение, медиану, дисперсию, стандартное отклонение, минимальное и максимальное значения выборки, размах (широту) выборки, асимметрию, эксцесс.

Проверить значимость отклонения от нуля коэффициентов асимметрии и эксцесса с заданным уровнем значимости:

α = 0.10.

Результаты.

Объём выборки

101


Среднее

121,529703


Медиана

121,5


Дисперсия

5,943870209


Станд.отклонение

2,438005375


Минимум

115,2


Максимум

130


Размах

14,8



границы


Асимметрия

0,229715932

(-0,389; 0,389)

незначимо

Эксцесс

0,868236435

(-0,65; 0,77)

значимо


Задание 2

распределение отклонение эксцесс значимость

Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).

Лист2, столбец А

Статистическая задача. Построить гистограмму выборочных данных по заданным интервалам группировки:    

X0 = 113.25 - правая граница первого интервала (от -¥ до X0),

D = 1 - ширина интервалов,

r = 16 - общее число интервалов с учётом двух крайних.

Найти оценку моды распределения.

На график гистограммы наложить график функции плотности гипотетического распределения:  

H0: нормальное.

Результаты.


Мода распределения =121,53.

Задание 3

Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).

Лист2, столбец А

Статистическая задача. Построить график эмпирической функции распределения выборочных данных, совмещенный с графиком функции распределения гипотетического распределения:  

H0: нормальное.

Вычислить максимальное расхождение между эмпирической и гипотетической функциями распределения.

Результаты.


Задание 4

Описание данных. Измерялась прочность металла контрольных образцов, снятых с дисков турбин авиадвигателя (по одному с каждого диска).

Лист2, столбец А

Статистическая задача. Проверить (по критерию хи-квадрат) гипотезу согласия выборочных данных с гипотетическим распределением:

α=0.01,       H0: нормальное.

Результаты.

Группированные

среднее

121.53

дисперсия

5.944


границы

частоты

χ2 (ni- n pi)2/ n pi


выборочные ni


£113.25

0

0,034518824

0,0345188

114.25

0

0,108255433

0,1082554

115.25

1

0,362335206

1,1222105

116.25

1

1,027215438

0,0007211

117.25

1

2,466715838

0,8721132

118.25

5

5,017616122

6,185Е-05

119.25

11

8,645859537

0,6409978

120.25

12

12,62003256

0,0304627

121.25

11

15,60489144

1,3588704

122.25

18

16,34604295

0,1673539

123.25

20

14,504973

2,081722

124.25

12

10,90364163

0,1102386

125.25

5

6,943392251

0,5439378

126.25

1

3,745499088

2,0124862

127.25

1

1,711493588

0,2957786

³127.25

2

0,957517088

1,1349882

Всего

101

101

χ2=10,514717


15 степеней свободы

a15=0,213824

a13=0,348601



1%-ое критическое значение

32


гипотеза нормальности

отвергается


с критическим уровнем значимости

αcrit = 0.348601


Вывод. Данные слабо значимо свидетельствуют против предположения о нормальности распределения выборки.

Задание 5

Описание данных. Измерялось верхнее артериальное давление до и после проведения комплекса оздоровительных мероприятий в некоторой группе пациентов. Каждое значение представляет собой среднее арифметическое многократных измерений давления у одного пациента в течение дня.

Sheet2, столбцы В, С

Статистическая задача. Проверить гипотезу отсутствия эффекта оздоровительных мероприятий по критерию Стьюдента (в предположении нормальности распределения наблюдений) при заданном уровне значимости и выбранной альтернативе относительно истинного среднего значения:

α=0.05,       K: Уменьшится.

Результаты.


До

После

Разность

Объём выборки

69

69

69

Среднее

153,5434783

124,3492754

29,1942029

Станд.отклонение

8,950612938

7,317016561

5,451602186

Станд.ошибка среднего

1,085421252

0,887318593

0,661103872

Статистика Стьюдента

T=44.16

5%-ая критическая область

> 1,667572281

Гипотеза отсутствия эффекта

отвергается

с критическим уровнем значимости

αcrit <0.001


Вывод. Данные подтверждают предположение об уменьшении давления после лечения.

По смыслу задачи каждое значение в одной выборке зависит от соответствующего значения в другой, поэтому вместо двух измерений рассмотрим их разность. Если верна гипотеза H0, т.е. эффект отсутствует, то статистика Стьюдента Т имеет распределение Стьюдента с n-1 степенями свободы. Полученное значение статистики Стьюдента попадает в критическую область с заданным уровнем значимости, поэтому мы отвергаем гипотезу об отсутствии эффекта.

Пояснения:

Альтернатива: уменьшится, тогда αcrit =1-S(t). Поэтому мы используем αcrit =СТЬЮДРАСП (x, n - 1,1), а для критической константы СТЬЮРАСПОБР.

Задание 6

Описание данных. Измерялось содержание некоторой примеси в пищевом продукте до и после специальной обработки. Нет оснований предполагать нормальность распределения данных.

Sheet2, столбцы E, F

Статистическая задача. Проверить гипотезу отсутствия влияния обработки на содержание примеси по критерию знаков при заданном уровне значимости и ожидаемом эффекте:

α=0.05, Ожидается: Уменьшается.

Результаты.

Частота ожидаемого эффекта

1


30 из 30

5%-ая критическая область

>20

Гипотеза отсутствия эффекта

отвергается

с критическим уровнем

αcrit << 0.001


Вывод. Данные высоко значимо подтверждают предположение о влиянии специальной обработки на величину примеси.

Пояснения:

Критический уровень значимости по формуле биномиального распределения равен:

αcrit=1-sup P {M£m|n, p} (*)

При условии, что p³0,5.

Очевидно, что supremum достигается при p=0.5.

Критическую константу же мы находим, исходя из заданного уровня значимости варьируя число успехов.

Задание 7

Описание данных. Фиксировалось среднее значение нескольких измерений в течение суток верхнего артериального давления у пациентов в двух, не связанных между собой, группах. Можно предположить, что для каждого пациента усредненный результат представляет собой реализацию нормальной случайной величины с одинаковой для обеих групп дисперсией.

Sheet2, столбцы G, H

α=0.05,       K: 1-ая группа меньше.

Результаты.


Группа A

Группа B

Объём наблюдений

28

40

Среднее

168,9571429

168,455

Станд.отклонение

10,58261474

9,77453196

Станд.ошибка среднего

2,096625156

1,56517776

Статистика Стьюдента T

0,198

5%-ая критическая область

> 1.667916

Гипотеза совпадения групп

принимается

с критическим уровнем значимости

αcrit = 0.58


Вывод. Расхождение в измерениях артериального давления у пациентов в двух группах статистически незначимо. Группы можно считать однородными.

Задание 8

Описание данных. Измерялось содержание витаминов группы В (в у. е.) в овощах, выращенных с использованием двух различных типов удобрений.

Sheet2, столбцы I, J

Статистическая задача. При заданном уровне значимости α и альтернативе K проверить по критерию Вилкоксона гипотезу о том, что функции распределения измерений в каждой группе совпадают:

α=0.01, K: 1-ая гр. Меньше

Результаты.

Объемы выборок

n1=29

n2=19

Сумма рангов 1-й выборки

669

Среднее значение (стат Виликсона)

710,5

1%-я критическая область

>599.7

Гипотеза идентичности групп

принимается

с критическим уровнем значимости

αcrit =0,19


Вывод. Тип удобрения влияет на витамины в овощах.

Задание 10

Описание данных. Измерялось содержание сахара в крови в двух группах больных сахарным диабетом. Исследователь не обладает никакой информацией о типе распределения измерений в группах, а также о возможном соотношении между этими распределениями.

Sheet2, столбцы M, N

Статистическая задача. При заданном уровне значимости α и границах интервалов разбиения проверить по критерию хи-квадрат гипотезу об однородности измерений в группах:

α=0.1; X0=13       Δ=2   r=7

Результаты.


Относительные частоты


Границы

Группа А

Группа В

χ2

13

0,147059

0,12381

0,206753

14

0,127451

0,038095

5,030203

15

0,107843

0,085714

0,262227

16

0,068627

0,108662

17

0,107843

0,114286

0,019328

18

0,088235

0,066667

0,311397

>19

0,352941

0,514286

3,097815

Σ

1

1

9,036384

Объём

102

88


10%-я критическая область

>10,644

Гипотеза однородности групп

принимается

с критическим уровнем значимости

αcrit = 0.1715


Вывод. Группы больных не значимо различаются по содержанию сахара в крови.

Задание 11

Описание данных. Измерялась длина хвоста редкой породы ящериц.

Sheet2, столбец O

Статистическая задача. Предполагая нормальность распределения выборочных данных, построить доверительный интервал для среднего значения длины хвоста ящериц изучаемой породы при заданном уровне надежности:

Q = 0.9, Граница: верхняя.

Результаты.

Выборочное среднее

51,00816

Дисперсия

27,02728

Объём выборки

49

Станд. ошибка среднего

0,750379

α квантиль

1,299439

90%-ый доверительный интервал для среднего всей совокупности

51,98323


Пояснения:

Найдем  - выборочное среднее,  - выборочную дисперсию. Отношение стандартного отклонения и корня из числа степеней свободы дает нам стандартную ошибку среднего.

Опорная функция монотонно убывает и имеет

распределение Стьюдента S с (n-1) степенью свободы. Вычисляем верхнюю квантиль(tα), т.е. решение уравнения S(t)=1-α. Тогда верхняя доверительная граница для среднего

Задание 12

Описание данных. Измерялась наполняемость консервной банки со шпротами, произведенными на экспериментальной производственной линии.

Sheet2, столбец P

Статистическая задача. Предполагая нормальность распределения выборочных данных, построить доверительный интервал для дисперсии при заданном уровне надежности:

Q=0.95,      Граница: Двусторонняя.

Результаты.

Объём выборки

57

Дисперсия

22,915

1-α квантиль распределения

39,80128

α квантиль распределения

74,46832

90%-ая двусторонняя граница для дисперсии для станд. отклонения

 [17.53974; 32.8169] [4.188047; 5.728604]


Пояснения:

Квантили хи-квадрат распределения находятся по следующим формулам:

 = ХИ2ОБР (1-p; m).

 = ХИ2ОБР (p; m).

Строятся доверительные границы


Похожие работы на - Распределение данных

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!