Cтатистическая надежность регрессионного моделирования
Вариант 4-1
1. Рассчитайте параметры уравнения
линейной регрессии
2. Оцените тесноту связи с помощью
показателей корреляции и детерминации
3. Определите среднюю ошибку
аппроксимации. Сделайте выводы
4. Оцените статистическую надежность
регрессионного моделирования с помощью F-критерия Фишера и t-критерия Стьюдента
5. Оцените полученные результаты,
оформите выводы
№ набл.
|
Район
|
Средний размер назначенных
ежемесячных пенсий, тыс.руб., y
|
Прожиточный минимум в среднем на
одного пенсионера в месяц, тыс.руб., x
|
|
|
1
|
Брянская обл.
|
240
|
178
|
|
2
|
Владимирская обл.
|
226
|
202
|
|
3
|
Ивановская обл.
|
221
|
197
|
|
4
|
Калужская обл.
|
226
|
201
|
|
5
|
Костромская обл.
|
220
|
189
|
|
6
|
г.Моска
|
250
|
302
|
|
7
|
Москавская обл.
|
237
|
215
|
|
8
|
Орловская обл.
|
232
|
166
|
|
9
|
Рязанская обл.
|
215
|
199
|
|
10
|
Смоленская обл.
|
220
|
180
|
|
11
|
Тверская обл.
|
222
|
181
|
|
12
|
Тульская обл.
|
231
|
186
|
|
13
|
Ярославская обл.
|
229
|
250
|
|
Fтабл.=4,84(α =0,05)
|
=9,29
|
=34,75
|
|
1. Расчет параметров уравнения линейной
регрессии по данным таблицы:
Решение:
1. Уравнение линейной
регрессии имеет следующий вид:
№ наблюдения
|
y
|
X2
|
X·Y
|
yx
|
y- yx
|
Ai
|
1
|
178
|
240
|
31684
|
42720
|
222,51
|
17,49
|
7,29
|
2
|
202
|
226
|
40804
|
45652
|
227,67
|
-1,67
|
0,74
|
3
|
197
|
221
|
38809
|
43537
|
226,59
|
-5,59
|
2,53
|
4
|
201
|
226
|
40401
|
45426
|
227,45
|
-1,45
|
0,64
|
5
|
189
|
220
|
35721
|
41580
|
224,87
|
-4,87
|
2,22
|
6
|
302
|
250
|
91204
|
75500
|
249,17
|
0,83
|
0,33
|
7
|
215
|
237
|
46225
|
50955
|
230,46
|
6,54
|
2,76
|
8
|
166
|
232
|
27556
|
38512
|
219,93
|
12,07
|
5,20
|
199
|
215
|
39601
|
42785
|
227,02
|
-12,02
|
5,59
|
10
|
180
|
220
|
32400
|
39600
|
222,94
|
-2,94
|
1,34
|
11
|
181
|
222
|
32761
|
40182
|
223,15
|
-1,15
|
0,52
|
12
|
186
|
231
|
34596
|
42966
|
224,23
|
6,77
|
2,93
|
13
|
250
|
229
|
62500
|
57250
|
237,99
|
-8,99
|
3,93
|
Сумма
|
2646
|
2969
|
554262
|
606665
|
|
|
|
Ср. значение
|
203,54
|
228,38
|
42635,54
|
46666,54
|
|
|
2,77
|
|
|
|
|
|
|
|
|
|
Найдем b:
Тогда
Уравнение линейной
регрессии имеет вид:
ŷx =184,239+0,215x
2. а) Рассчитываем
коэффициент корреляции:
по формуле:
rxy = b — = 0,21 =0,78
с помощью статистической
функции КОРРЕЛ-r =0,78
Связь между переменными x
и y прямая, средняя, близкая к сильной, т.е. величина среднемесячной пенсии в
значительной мере зависит от прожиточного минимума в среднем на одного
пенсионера в месяц
б) Для определения
средней ошибки аппроксимации рассчитываем столбцы
yx , y- yx ,
Ai :
Ai = y- yx *
100, А = 1/n∑ni=1 Ai
Получаем значение средней
ошибки аппроксимации
А = 2,77%
Величина ошибки
аппроксимации говорит о хорошем качестве модели.
в) Величина коэффициента
детерминации получена с помощью функции
ЛИНЕЙН R2 = rxy2 = 0,61,
то есть в 61% случаев
изменения среднемесячного прожиточного минимума на одного пенсионера приводят к
изменению среднемесячной пенсии. Другими словами – точность подбора регрессии
61 % - средняя.
а) по критерию Фишера:
1. Выдвигаем нулевую
гипотезу о статистической незначимости параметров регрессии и показателя
корреляции а = b = rxy =0;
2. Фактическое значение
критерия получено из функции ЛИНЕЙН
∑(ỹx-y)²/m r²xy0,61
Fфакт= = (n-2) = (13-2) = 1,56*11 = 17,2;
∑(y-ỹ)²
/(n-m-1) 1-r²xy 1-0,61
3. Fтабл =4,84
4. Сравниваем фактическое
и табличное значения критерия Fфакт>
Fтабл , т.е.нулевую гипотезу отклоняем и
делаем вывод о статистической значимости и надежности полученной модели.
б) по критерию
Стьюдента:
1. Выдвигаем гипотезу о
статистически незначимом отличии показателей от нуля: a = b = r²xy = 0;
2. Табличное значение t – критерия зависит от числа степеней
свободы и заданного уровня значимости α. Уровень значимости – это
вероятность отвергнуть правильную гипотезу.
rxy √(n-m)
t=
√(1- r2xy)
Где n – количество наблюдений; m – количество факторов.
t= 0,78√(13-2)= 2,59=4,18
√(1-0,61)0,62
3. Фактические значения t-критерия рассчитываются отдельно для
каждого параметра модели. С этой целью сначала определяются случайные ошибки
параметров mа , mb, mrxy .
mа=Sост √∑х2
= 1,65;
mb= Sост = 0,004
nσх σх√n
mrxy= √(1- r2xy) = 0,062
n-m-1
где Sост=√(∑ (y- yx )
) = 5 = 0,5
n-m-110
Рассчитываем фактические
значения t – критерия:
tфа =a/ mа =111,66
tфb =b/ mb =53,75
tфrxy= rxy/mrxy
= 12,58
tфа>tтабл ; tфb>tтабл ; tфrxy >tтабл . Нулевую гипотезу отклоняем ,
параметры a, b, rxy -
не случайно отличаются от нуля и являются статистически значимыми и надежными.