Определение зависимости цены товара
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ
ИНСТИТУТ
ЛАБОРАТОРНАЯ РАБОТА ПО ЭКОНОМЕТРИКЕ
Вариант1
Смоленск, 2007
Имеются следующие данные:
№
|
prise
|
DEN
|
polyamid
|
lykra
|
firm
|
|
Y
|
X1
|
X2
|
X3
|
X4
|
1
|
49,36
|
20
|
86
|
14
|
0
|
2
|
22,51
|
20
|
97
|
3
|
1
|
3
|
22,62
|
20
|
97
|
3
|
1
|
4
|
59,89
|
20
|
90
|
17
|
0
|
5
|
71,94
|
30
|
79
|
21
|
0
|
6
|
71,94
|
30
|
79
|
21
|
0
|
7
|
89,9
|
30
|
85
|
15
|
1
|
8
|
74,31
|
40
|
85
|
13
|
1
|
9
|
77,69
|
40
|
88
|
10
|
1
|
10
|
60,26
|
40
|
86
|
14
|
1
|
11
|
111,19
|
40
|
82
|
18
|
0
|
12
|
73,56
|
40
|
83
|
14
|
1
|
13
|
84,61
|
40
|
84
|
16
|
0
|
14
|
49,9
|
40
|
82
|
18
|
1
|
15
|
89,9
|
40
|
85
|
15
|
0
|
16
|
96,87
|
50
|
85
|
15
|
0
|
17
|
39,99
|
60
|
98
|
2
|
1
|
18
|
49,99
|
60
|
76
|
24
|
0
|
19
|
49,99
|
70
|
83
|
17
|
1
|
20
|
49,99
|
70
|
88
|
10
|
1
|
21
|
49,99
|
70
|
76
|
24
|
0
|
22
|
49,99
|
80
|
42
|
8
|
1
|
23
|
129,9
|
80
|
50
|
42
|
0
|
24
|
84
|
40
|
82
|
18
|
0
|
25
|
61
|
20
|
86
|
14
|
0
|
26
|
164,9
|
30
|
16
|
30
|
1
|
27
|
49,9
|
40
|
82
|
18
|
1
|
28
|
89,9
|
30
|
85
|
15
|
1
|
29
|
129,9
|
80
|
50
|
42
|
0
|
30
|
89,9
|
40
|
86
|
14
|
1
|
31
|
105,5
|
40
|
85
|
15
|
1
|
32
|
79,9
|
15
|
88
|
12
|
1
|
33
|
99,9
|
20
|
88
|
12
|
1
|
34
|
99,9
|
30
|
73
|
25
|
1
|
35
|
119,9
|
20
|
85
|
12
|
1
|
36
|
109,9
|
20
|
83
|
14
|
1
|
37
|
59,9
|
20
|
86
|
14
|
0
|
38
|
79,9
|
40
|
82
|
18
|
0
|
39
|
82,9
|
20
|
86
|
14
|
0
|
40
|
111,8
|
40
|
82
|
18
|
0
|
41
|
83,6
|
40
|
82
|
18
|
0
|
42
|
60
|
20
|
86
|
14
|
0
|
43
|
80
|
40
|
82
|
18
|
0
|
44
|
90
|
50
|
76
|
24
|
0
|
45
|
120
|
70
|
74
|
26
|
0
|
Задача состоит в построении линейной модели
зависимости цены колготок от их плотности, состава и фирмы-производителя в
торговых точках города Москвы и Московской области весной 2006 года.
Цена колготок – это зависимая переменная Y. В
качестве независимых, объясняющих переменных были выбраны: плотность (DEN) X1,
содержание полиамида X2 и лайкры X3, фирма-производитель X4.
Описание переменных содержится в Таблице 1.1:
Таблица 1.1.
Переменная
|
Описание
|
№
|
номер торговой точки
|
price
|
цена колготок в рублях
|
DEN
|
плотность в DEN
|
polyamid
|
содержание полиамида в %
|
lykra
|
содержание лайкры в %
|
firm
|
фирма-производитель:
0 - Sanpellegrino, 1 -
Грация
|
Задание:
1.
Рассчитайте матрицу парных
коэффициентов корреляции; оцените статистическую значимость коэффициентов корреляции.
Поясните выбор факторов для включения в модель.
2.
Постройте уравнение регрессии. Оцените
статистическую значимость параметров регрессионной модели с помощью t-критерия;
нулевую гипотезу о значимости уравнения проверьте с помощью F-критерия; оцените
качество уравнения регрессии с помощью коэффициента детерминации .
3.
Постройте уравнение множественной
регрессии только со статистически значимыми факторами. Рассчитайте
доверительный интервал для каждого наблюдения (уровень значимости примите
равным 5%). Результаты п.3 отобразить графически (исходные данные,
Решение.
1.Для проведения
корреляционного анализа необходимо выполнить следующие действия:
Данные для корреляционного
анализа должны располагаться в смежных диапазонах ячеек.
Выбрать команду Сервис –
Анализ данных.
В диалоговом окне анализ
данных выберите инструмент Корреляция, а затем щелкнуть на кнопке ОК.
В диалогом окне Корреляция
в поле Входной интервал необходимо ввести диапазон ячеек, содержащих исходные
данные(значения Х и У).Если выделены и заголовки столбцов, то установить флажок
Метки в первой строке.
Выбрать параметры вывода. ОК.
Матрица парных
коэффициентов корреляции.
Анализ матрицы
коэффициентов парной корреляции показывает, что фактор Х3(содержание лайкры)
оказывает наибольшее влияние на У(цена колготок), т.к.
КПК │rx2x3=-0.67│
< 0.8
значит,
мультиколлинеарность отсутствует.
Посмотрим как влияют коэффициенты
Х2 и Х3 на У.
│ ryx2= -0.56 │
< │ryx3=0.6│,
следовательно фактор Х3
оказывает большее влияние на У, но в ММР включаем и Х2 и Х3, т.к. Явление МК
отсутствует.
2.Для проведения
регрессионного анализа выполним:
Команду Сервис – Анализ
данных. В диалоговом окне выберем инструмент Регрессия, а затем ОК. В поле
Входной интервал У введем адрес значений У из заданной таблицы. В поле Входной
интервал Х – адрес значений Х.
Данные регрессионного
анализа:
Запишем модель регрессии в
линейной форме:
У=104,16 – 0,48Х1 – 0,59Х2
+ 2,25Х3 + 7,55Х4
Оценим значимость факторов
с помощью Т –критерия Стьюдента, для этого, определим его табличное значение
при уровне значимости 0,05.
к =n-m-1=45-4-1=40 t-кр.таб=2.0211
Сравним расчетные значения
с табличным по модулю:
│t X1= -2.334│
> t –табл. = 2,021,
следовательно фактор
Х1(плотность) является статистически значимым, и статистически значимым
признается влияние плотности колготок на их цену.
│t X2= -1,763│<
t –табл. = 2,021,
следовательно фактор Х2 –
содержание полиамида – является статистически незначимым.
следовательно фактор Х3 –
содержание лайкры – является статистически значимым, и статистически значимым
признается влияние содержания лайкры в колготках на их цену.
│t X4= 0,966 │<
t –табл. = 2,021,
следовательно фактор Х4 –
фирма-производитель – является статистически незначимым.
Оценка статистической
значимости уравнения регрессии в целом осуществляется по F – критерию Фишера: Fтабл.=
2,61
Так как Fрасч. > Fтабл.(9,59
> 2.61), то уравнение регрессии можно признать статистически значимым
(адекватным).
Оценка общего качества
уравнения регрессии происходит с использованием коэффициента детерминации.
Так как R=0.489, то 48,9%
вариации результативного показателя – цены колготок – объясняется вариацией
факторных признаков, включенных в модель регрессии – плотность, содержание
лайкры и полиамида, фирмы – производителя.
3.Постройте уравнение
множественной регрессии только со статистически значимыми факторами.
Рассчитайте доверительный интервал для каждого наблюдения, (уровень значимости
примите равным 5%). Укажите торговые точки, в которых цены завышены.
№
|
prise
|
DEN
|
lykra
|
|
Y
|
X1
|
X3
|
1
|
49,36
|
20
|
14
|
2
|
22,51
|
20
|
3
|
3
|
22,62
|
20
|
3
|
4
|
59,89
|
20
|
17
|
5
|
71,94
|
30
|
21
|
6
|
71,94
|
30
|
21
|
7
|
89,9
|
30
|
15
|
8
|
74,31
|
40
|
13
|
9
|
77,69
|
40
|
10
|
10
|
60,26
|
40
|
14
|
11
|
111,19
|
40
|
18
|
12
|
73,56
|
40
|
14
|
13
|
84,61
|
40
|
16
|
14
|
49,9
|
40
|
18
|
15
|
89,9
|
40
|
15
|
16
|
96,87
|
50
|
15
|
17
|
39,99
|
60
|
2
|
18
|
49,99
|
60
|
24
|
19
|
49,99
|
70
|
17
|
20
|
49,99
|
70
|
10
|
21
|
49,99
|
70
|
24
|
22
|
49,99
|
80
|
8
|
23
|
129,9
|
80
|
42
|
24
|
84
|
40
|
18
|
25
|
61
|
20
|
14
|
26
|
164,9
|
30
|
30
|
27
|
49,9
|
40
|
18
|
28
|
89,9
|
30
|
15
|
29
|
129,9
|
80
|
42
|
30
|
89,9
|
40
|
14
|
31
|
105,5
|
40
|
15
|
32
|
79,9
|
15
|
12
|
33
|
99,9
|
20
|
12
|
34
|
99,9
|
30
|
25
|
35
|
119,9
|
20
|
12
|
36
|
109,9
|
20
|
14
|
37
|
59,9
|
20
|
14
|
38
|
79,9
|
40
|
18
|
39
|
82,9
|
20
|
14
|
40
|
111,8
|
40
|
18
|
41
|
83,6
|
40
|
18
|
42
|
60
|
20
|
14
|
43
|
80
|
40
|
18
|
44
|
90
|
50
|
24
|
45
|
120
|
70
|
26
|
Эта операция проводится с помощью
инструмента анализа данных Регрессия. В диалоговом окне при заполнении
параметра входной интервал Х следует указать все столбцы.
Уравнение регрессии в
линейной форме:
У = 49,89 – 0,37Х1 +
2,65Х3.
Уравнение статистически
значимо. Каждый факторный признак характеризует влияние на общую стоимость
колготок.
Для нахождения
доверительного интервала воспользуемся формулой:
У = а ± ∆а
У = в ± ∆в
а=49,89; в1= -0,37;в3= 2,65
∆в=mв*tтаб.
Коэффициент Стьюдента для k
=42 и уровня значимости 0,05 равен 2,0211.
∆а=9,45
∆в=0,208*2,0211=0,420
∆в3=0,489*2,0211=0,988
Цены завышены во всех
точках, кроме точек под номерами 1,2,3,14,17.
4. Представим графически
исходные данные:
Представим графически
предсказанные значения: