Зависимость между прибылью заводов и объемами выпусков их продукции
Задание
Составить корреляционную таблицу по имеющимся
данным:
прибыль продукция регрессия
корреляция
Объём
выпуска, тыс. ед.
|
Число
заводов
|
Прибыль
по отдельным заводам, млн. руб.
|
0
-10
|
3
|
1,
2, 3
|
11
-20
|
5
|
2,
3, 4, 5, 6
|
21
-30
|
7
|
4,
5, 6, 7, 7, 8, 8
|
31
- 40
|
3
|
7,
9, 11
|
41
- 50
|
2
|
12,
13
|
1. Вычислить групповые средние и
и
построить эмпирические линии регрессии.
2. Предполагая, что между переменными X и
Y существует линейная корреляционная зависимость:
a. Найти уравнения прямых
регрессии, построить их графики на одном чертеже с эмпирическими линиями
регрессии и дать содержательную интерпретацию полученных уравнений;
b. Вычислить коэффициент корреляции, на
уровне α=0,05
оценить
его достоверность и сделать вывод о тесноте и направлении связи между
переменными X и Y.
Основная часть
Составим корреляционную таблицу по имеющимся
данным.
Таблица 1 - Исходные данные
Объём
выпуска, тыс. ед.Число заводовПрибыль по отдельным заводам, млн. руб.
|
|
|
0-10
|
3
|
1,
2, 3
|
11-20
|
5
|
2,
3, 4, 5, 6
|
21-30
|
7
|
4,
5, 6, 7, 7, 8, 8
|
31-40
|
3
|
7,
9, 11
|
41-50
|
2
|
12,
13
|
Будем рассматривать зависимость между прибылью
заводов (величина X) и их объемами выпусков (величина Y). Результатом первичной
обработки будем таблица 2.
Таблица 2 - Корреляционная таблица
X\Y
|
Середины
|
0-10
|
10-20
|
20-30
|
30-40
|
40-50
|
nX
|
Середины
|
|
5
|
15
|
25
|
35
|
45
|
|
1-3
|
2
|
2
|
1
|
|
|
|
3
|
3-5
|
4
|
1
|
2
|
1
|
5-7
|
6
|
|
2
|
2
|
|
|
4
|
7-9
|
8
|
|
|
4
|
1
|
|
5
|
9-11
|
10
|
|
|
|
1
|
|
1
|
11-13
|
12
|
|
|
|
1
|
1
|
2
|
13-15
|
14
|
|
|
|
|
1
|
1
|
nY
|
|
3
|
5
|
7
|
3
|
2
|
20
|
Вычислим групповые средние и
и
построим эмпирические линии регрессии.
Таблица 3 - Групповые средние
X (середины интервалов)
|
2
|
4
|
6
|
8
|
10
|
12
|
14
|
Групповые средние
|
8,3333
|
15,0000
|
20,0000
|
27,0000
|
35,0000
|
40,0000
|
45,0000
|
|
|
|
|
|
|
|
|
Таблица 4 - Групповые средние
Y (середины интервалов)
|
5
|
15
|
25
|
35
|
45
|
Групповые средние
|
2,6667
|
4,4000
|
6,8571
|
10,0000
|
13,0000
|
|
|
|
|
|
|
По таблицам 3 и 4 построим эмпирические линии
регрессии.
Рисунок 1 - Эмпирическая линия регрессии
величины Y
Рисунок 2 - Эмпирическая линия регрессии
величины X
Предполагая, что между переменными X и Y
существует линейная корреляционная зависимость найдём уравнения прямых
регрессии, имеющих вид
.
Коэффициенты a0, a1, b0,
b1 находим из систем уравнений
Построим вспомогательную таблицу 5.
Таблица 5 - Расчётная таблица
i,j
|
xj
|
nx
|
xj nx
|
хj2 nx
|
yi
|
ny
|
yiny
|
yi2ny
|
nxjyi
|
1
|
2
|
3
|
6
|
12
|
5
|
3
|
15
|
75
|
40
|
2
|
4
|
4
|
16
|
64
|
15
|
5
|
75
|
1125
|
330
|
3
|
6
|
4
|
24
|
144
|
25
|
7
|
175
|
4375
|
1200
|
4
|
8
|
5
|
40
|
320
|
35
|
3
|
105
|
3675
|
1050
|
5
|
10
|
1
|
10
|
100
|
45
|
2
|
90
|
4050
|
1170
|
6
|
12
|
2
|
24
|
288
|
|
|
|
|
7
|
14
|
1
|
14
|
196
|
|
|
|
|
|
Σ
|
56
|
20
|
134
|
1124
|
125
|
20
|
460
|
13300
|
3790
|
Подставляя суммы из таблицы 5 в системы
уравнений, находим коэффициенты:
0=2,029;
a1=3,130; b0=0,713; b1=0,260.
Таким образом, уравнения прямых регрессии примут
вид:
.
Построим графики этих уравнений по таблицам 6 и
7.
Таблица 6 - и
групповые средние
X (середины интервалов)
|
2
|
4
|
6
|
8
|
10
|
12
|
14
|
Групповые средние
|
8,3333
|
15,0000
|
20,0000
|
27,0000
|
35,0000
|
40,0000
|
45,0000
|
|
8,289
|
14,549
|
20,809
|
27,069
|
33,329
|
39,589
|
45,849
|
Таблица 7 - и
групповые средние
Y (середины интервалов)
|
5
|
15
|
25
|
35
|
45
|
Групповые средние
|
2,6667
|
4,4000
|
6,8571
|
10,0000
|
13,0000
|
|
2,013
|
4,613
|
7,213
|
12,413
|
Рисунок 3 - Линии регрессии и эмпирической
регрессии величины Y
Рисунок 4 - Линии регрессии и эмпирической
регрессии величины X
Найденные линии регрессии позволяют сказать о
сильной положительной зависимости X и Y. Чтобы удостовериться в этом, найдём
коэффициент корреляции. Он может быть найден по формуле:
Все необходимые средние величины уже записаны в
таблице 5.
Вычисляя, получим r=0,9026. Таком образом, можно
сделать вывод о том, что связь величин X и Y высокая, положительная (r>0),
т.е. с возрастанием X возрастает Y и наоборот.
Проверим справедливость этих выводов для
генеральной совокупности. На уровне α = 0,05 проверим
значимость коэффициента корреляции с помощью t-критерия:
В нашем случае t=5,9310. Для α
= 0,05 и
k = n - 2 =18 получим критическое значение критерия по таблице распределения
Стьюдента равным .
Т.к. t > tкр. , то гипотеза об
отсутствии линейной корреляционной зависимости между Х и У опровергается.
Коэффициент корреляции считается достоверным.
Заключение
Зависимость между величинами X и Y существует и
она сильная. Следовательно, с увеличением объёмов выпуска прибыль также
увеличивается.