Статистика предприятия
Федеральное
агентство железнодорожного транспорта
Омский
государственный университет путей сообщения
Кафедра
"Экономика транспорта, логистика и управление качеством"
Практическая
работа
по дисциплине
"Статистика"
Выполнила:
студентка группы 168Пп
Кочнева А.С.
Проверил:
доцент кафедры ЭиУК
Симак Р.С.
Омск 2012
Содержание
Исходные данные
. Средние статистические величины
. Аналитическая группировка статистических данных
. Корреляционно-регрессионный анализ
3.1Коэффициент Фехнера
.2Коэффициент корреляции
.3Регрессионный анализ
Выводы
Исходные данные
В соответствии с заданием номер шифра - 1323. Исходные данные
представлены в табл. 1.
Таблица 1
Цех 1
|
Цех 2
|
Цех 3
|
Цех 4
|
№
|
Воз-раст
|
Экспл. расходы,
тыс.руб.
|
№
|
Воз-раст
|
Экспл. расходы,
тыс.руб.
|
№
|
Возраст
|
Экспл. расходы,
тыс.руб.
|
№
|
Воз-раст
|
Экспл. расходы,
тыс.руб.
|
1
|
10
|
22,0
|
1
|
11
|
25,4
|
1
|
14
|
31,0
|
1
|
7
|
12,1
|
2
|
12
|
24,1
|
2
|
16
|
27,9
|
2
|
9
|
27,6
|
2
|
7
|
18,3
|
3
|
7
|
20,8
|
3
|
13
|
27,4
|
3
|
7
|
26,1
|
3
|
7
|
18,4
|
4
|
13
|
24,5
|
4
|
16
|
28,3
|
4
|
1
|
20,7
|
4
|
11
|
24,0
|
5
|
15
|
26,6
|
5
|
13
|
27,8
|
5
|
10
|
28,9
|
5
|
11
|
21,9
|
6
|
6
|
19,4
|
6
|
19
|
29,5
|
6
|
10
|
28,7
|
6
|
12
|
23,5
|
7
|
10
|
22,5
|
7
|
17
|
29,9
|
7
|
6
|
24,8
|
7
|
13
|
22,1
|
8
|
6
|
19,6
|
8
|
16
|
28,1
|
8
|
6
|
24,5
|
8
|
8
|
17,7
|
9
|
4
|
19,9
|
9
|
6
|
23,3
|
9
|
8
|
24,5
|
9
|
11
|
21,5
|
10
|
4
|
19,0
|
10
|
13
|
26,3
|
10
|
17
|
34,0
|
10
|
12
|
24,0
|
11
|
8
|
21,0
|
11
|
2
|
22,2
|
11
|
3
|
22,8
|
11
|
9
|
19,1
|
12
|
8
|
21,1
|
12
|
6
|
23,7
|
12
|
7
|
26,3
|
12
|
19
|
26,0
|
13
|
8
|
21,5
|
13
|
6
|
23,6
|
13
|
3
|
23,3
|
13
|
14
|
20,2
|
14
|
13
|
25,0
|
14
|
2
|
21,3
|
14
|
11
|
29,1
|
14
|
13
|
25,0
|
15
|
7
|
20,9
|
15
|
10
|
25,7
|
15
|
11
|
29,3
|
15
|
2
|
11,5
|
16
|
14
|
24,0
|
16
|
19
|
28,6
|
16
|
12
|
30,0
|
16
|
11
|
21,0
|
17
|
14
|
24,4
|
17
|
18
|
28,8
|
17
|
14
|
31,3
|
17
|
2
|
11,5
|
18
|
9
|
22,7
|
18
|
6
|
21,6
|
18
|
5
|
22,3
|
18
|
5
|
13,9
|
19
|
14
|
27,0
|
19
|
6
|
20,6
|
19
|
5
|
22,2
|
19
|
13
|
25,5
|
20
|
12
|
25,0
|
20
|
17
|
28,7
|
20
|
5
|
23,1
|
20
|
7
|
17,1
|
21
|
12
|
25,0
|
21
|
8
|
24,7
|
21
|
18
|
33,3
|
21
|
15
|
24,3
|
22
|
15
|
26,7
|
22
|
1
|
21,1
|
22
|
11
|
27,6
|
22
|
16
|
28,0
|
23
|
10
|
22,6
|
23
|
8
|
24,8
|
23
|
8
|
24,1
|
23
|
9
|
21,2
|
24
|
3
|
17,3
|
24
|
13
|
27,2
|
24
|
6
|
23,8
|
24
|
16
|
26,8
|
25
|
3
|
18,0
|
25
|
3
|
21,2
|
25
|
2
|
22,0
|
25
|
2
|
12,3
|
26
|
9
|
22,5
|
26
|
6
|
22,2
|
26
|
4
|
23,4
|
26
|
11,2
|
27
|
2
|
16,0
|
27
|
14
|
27,5
|
27
|
4
|
23,7
|
27
|
5
|
16,4
|
28
|
9
|
23,6
|
28
|
14
|
27,6
|
28
|
4
|
24,7
|
28
|
4
|
13,2
|
29
|
7
|
19,5
|
29
|
4
|
22,7
|
29
|
15
|
32,0
|
29
|
13
|
23,0
|
30
|
7
|
19,4
|
30
|
11
|
24,8
|
30
|
16
|
32,6
|
30
|
14
|
24,4
|
31
|
1
|
15,5
|
31
|
10
|
25,0
|
31
|
16
|
34,7
|
31
|
20
|
29,8
|
32
|
13
|
25,2
|
32
|
7
|
22,7
|
32
|
18
|
33,9
|
32
|
17
|
27,6
|
33
|
13
|
26,3
|
33
|
9
|
24,8
|
33
|
18
|
34,9
|
33
|
18
|
27,4
|
34
|
16
|
29,4
|
34
|
5
|
24,7
|
34
|
19
|
34,9
|
34
|
10
|
19,8
|
35
|
8
|
19,9
|
35
|
13
|
24,7
|
35
|
20
|
34,0
|
35
|
6
|
15,4
|
1.
Средние статистические
величины
Результаты расчета средних статистических величин представлены в табл. 2.
Таблица 2
Показатель
|
Цех 1
|
Цех 2
|
Цех 3
|
Цех 4
|
Средний возраст
оборудования, лет
|
9,2
|
10,2
|
9,8
|
10,3
|
Средние эксплуатационные
расходы, тыс. руб.
|
22,2
|
25,3
|
27,7
|
20,4
|
СКО возраста
оборудования, лет
|
3,90
|
5,11
|
5,42
|
4,96
|
СКО эксплуатационных
расходов, тыс. руб.
|
3,19
|
2,65
|
4,38
|
5,24
|
Медиана возраста
оборудования, лет
|
9
|
10
|
9
|
11
|
Самое изношенное оборудование в четвертом цехе (средний возраст - 10,3
года), наиболее высокие эксплуатационные расходы в третьем цехе (27,7 тыс.
руб.).
2.
Аналитическая
группировка статистических данных
Результаты аналитической группировки представлены в табл. 3 и 4.
Таблица 3
Группы по
возрасту, лет
|
Цех 1
|
Цех 2
|
|
Число станков в группе, шт
|
Средние экспл. расходы,
тыс. руб.
|
В процентах к
итогу
|
Число станков в группе, шт
|
Средние экспл. расходы,
тыс. руб.
|
В процентах к
итогу
|
от 1 до 5
|
6
|
23,00
|
17,1
|
6
|
24,50
|
17,1
|
от 6 до 10
|
16
|
18,56
|
45,7
|
12
|
23,00
|
34,3
|
от 11 до 15
|
12
|
19,08
|
34,3
|
9
|
20,11
|
25,7
|
от 16 до 20
|
1
|
29,40
|
2,9
|
8
|
12,00
|
22,9
|
Таблица 4
Группы по возрасту, лет
|
Цех 3
|
Цех 4
|
|
Число станков в группе, шт
|
Средние экспл. расходы,
тыс. руб.
|
В процентах к
итогу
|
Число станков в группе, шт
|
Средние экспл. расходы,
тыс. руб.
|
В процентах к
итогу
|
от 1 до 5
|
10
|
21,10
|
28,6
|
7
|
24,29
|
20,0
|
от 6 до 10
|
10
|
11,90
|
28,6
|
9
|
17,22
|
25,7
|
от 11 до 15
|
7
|
18,29
|
20,0
|
13
|
16,08
|
37,1
|
от 16 до 20
|
8
|
30,25
|
22,9
|
6
|
27,67
|
17,1
|
Гистограммы аналитической группировки данных по цехам представлены на рис.
1-4.
Рисунок 1 - Аналитическая группировка данных первого цеха
Рисунок 2 - Аналитическая группировка данных третьего цеха
Рисунок 3 - Аналитическая группировка данных четвертого цеха
Результаты расчета моды по цехам представлены в табл. 5.
Таблица 5
Номер цеха
|
Мода возраста
|
Цех 1
|
7,13,8
|
Цех 2
|
6
|
Цех 3
|
4,5,6,11,18
|
Цех 4
|
7,11,13
|
Анализ данных табл. 3 и 4 позволяют сделать следующие выводы:
по первому цеху:
наибольшие эксплуатационные расходы приходятся на парк станков возрастом
от 16 до 20 лет и составляют в среднем 29,40 тыс. руб. на один станок;
наименьшие эксплуатационные расходы приходятся на парк станков возрастом
от 6 до 10 лет и составляют в среднем 18,56 тыс. руб. на один станок;
по второму цеху:
наибольшие эксплуатационные расходы приходятся на парк станков возрастом
от 1 до 5 лет и составляют в среднем 24,50 тыс. руб. на один станок;
наименьшие эксплуатационные расходы приходятся на парк станков возрастом
от 16 до 20 лет и составляют в среднем 12,00 тыс. руб. на один станок;
по третьему цеху:
наибольшие эксплуатационные расходы приходятся на парк станков возрастом
от16 до 20 лет и составляют в среднем 30,25 тыс. руб. на один станок;
наименьшие эксплуатационные расходы приходятся на парк станков возрастом
от 6 до 10 лет и составляют в среднем 11,90 тыс. руб. на один станок;
по четвертому цеху:
наибольшие эксплуатационные расходы приходятся на парк станков возрастом
от 16 до 20 лет и составляют в среднем 27,67 тыс. руб. на один станок;
наименьшие эксплуатационные расходы приходятся на парк станков возрастом
от 6 до 10 лет и составляют в среднем 17,22 тыс. руб. на один станок.
3.
Корреляционно-регрессионный
анализ
.1
Коэффициент Фехнера
К простейшим показателям тесноты связи относят коэффициент корреляции
знаков - коэффициент Фехнера. Этот показатель основан на оценке степени
согласованности направлений отклонений индивидуальных значений факторного и
результативного признаков от соответствующих средних. Для его расчета вычисляют средние значения результативного и
факторного признаков, а затем проставляют знаки отклонений для всех значений
взаимосвязи пар признаков.
,(1)
Где Кф - коэффициент Фехнера; na - число пар, у которых знаки
отклонений значений от их средних совпадают; nв - число пар, у которых знаки отклонений значений от их
средних не совпадают.
Коэффициент Фехнера может принимать различные значения в пределах от -1
до +1. Если коэффициент близок к +1, то можно предположить наличие прямой
связи, если -1, то наличие обратной связи.
Результаты расчета коэффициента Фехнера по цехам представлены в табл. 6.
Таблица 6
Номер цеха
|
Коэффициент
Фехнера
|
Цех 1
|
0,771
|
Цех 2
|
0,829
|
Цех 3
|
0,943
|
Цех 4
|
0,886
|
3.2 Коэффициент
корреляции
Степень тесноты связи в статистике измеряют с помощью специального
показателя, называемого коэффициентом корреляции:
,(2)
где - значения факторного признака для i-го станка; - значения результативного признака
для i-го станка; - среднее значение факторного признака для всех станков; - среднее значение результативного
признака для всех станков; n -
общее число наблюдений (количество станков в цехе).
Представленный коэффициент корреляции предполагает, что между х и у
существует связь, которая является прямолинейной. В случае, когда связь между
признаками нелинейная, используются другие статистические показатели для
описания тесноты связи, рассмотрение которых не входит в задачу настоящих
методических указаний.
Значения коэффициента корреляции могут изменяться от -1 до 1. В случае R=1 между признаками существует полная
функциональная связь, причем связь прямая - при увеличении х увеличивается и у.
При R = -1
-связь функциональная и обратная (при увеличении х у уменьшается). В случае,
когда R=0, между изучаемыми признаками
отсутствует какая-либо связь.
Результаты расчета коэффициента корреляции по цехам представлены в табл. 7.
Таблица 7
Номер цеха
|
Коэффициент корреляции
|
Цех 1
|
0,963
|
Цех 2
|
0,942
|
Цех 3
|
0,975
|
Цех 4
|
0,952
|
Наиболее тесная связь между возрастом оборудования и эксплуатационными
расходами наблюдается в третьем цехе, что подтверждается значениями
коэффициентов Фехнера и коэффициента корреляции. Наименее тесная связь во
втором цехе, что также подтверждается значениями этих коэффициентов.
3.3
Регрессионный анализ
Вторым этапом изучения статистической связи вслед за определением степени
тесноты связи с помощью коэффициента корреляции идет этап установления формы
связи или вида функции φ(х), объясняющей основную закономерность влияния
факторного признака х на результативный признак у.
Под формой статистической связи понимают ту тенденцию, которая
проявляется в изменении изучаемого результативного признака в связи с
изменением факторного признака. Форму связи можно попытаться установить,
построив в прямоугольной системе координат все множество пар значений признаков
(хi, уi), . По оси абсцисс откладываются значения факторного признака
х, по оси ординат - значения
признака у. Такое графическое построение называется полем корреляции или
диаграммой рассеяния. По характеру расположения точек на координатной плоскости
можно судить о характере статистической связи. Если наблюдается тенденция
равномерного возрастания или убывания значений признака, то связь называется
прямолинейной. При тенденции неравномерного изменения значений зависимость
носит название криволинейной.
Линия на графике, изображающая тенденцию в изменении результативного
признака при возрастании факторного, называется линией регрессии. В случае
прямолинейной связи линия регрессии ищется в виде уравнения прямой линии:
,(3)
где у - теоретические значения результативного признака, образующие
прямую линию; а0, а1 - параметры уравнения; х - значения
факторного признака.
Расчет параметров уравнения производится методом наименьших квадратов. В
основу метода положено требование минимальности отклонения теоретических
значений у’i от эмпирических
(полученных в результате наблюдения) значений признака уi при одном и том же значении хi. Это требование в математических
обозначениях записывается следующим образом:
.(4)
Подставляя вместо теоретических значений их запись через параметры а0
и а1 , получаем
.(5)
В этом выражении известны все хi и уi, полученные в результате наблюдения, неизвестны лишь а0
и а1. Полученная функция двух переменных а0 и а1
имеет минимум, когда частные производные и одновременно равны 0. Произведя
дифференцирование по а0 и а1, получаем систему двух
уравнений с двумя неизвестными:
(6)
гдеn - общее число наблюдений; х, у -
значения признаков, полученные в результате наблюдения.
Решая данную систему уравнений, получим выражение для нахождения
коэффициентов а0 и а1:
,(7)
,(8)
статистический цех корреляция регрессия
гдеn - общее число наблюдений; х, у -
значения признаков, полученные в результате наблюдения.
Поля корреляции и уравнения регрессии для четырех цехов представлены на
рис. 5-8.
Рисунок 5 - Поле корреляции для характеристик оборудования первого цеха
Рисунок 6 - Поле корреляции для характеристик оборудования второго цеха
Рисунок 7 - Поле корреляции для характеристик оборудования третьего цеха
Рисунок 8 - Поле корреляции для характеристик оборудования четвертого
цеха
Для того, чтобы сделать выводы о том, на каком объекте наблюдения быстрее
увеличиваются с возрастом эксплуатационные расходы, необходимо произвести
анализ коэффициента в уравнении линейной регрессии (формула 3) по каждому цеху.
Максимальное значение данного коэффициента у четвертого цеха (1,005),
следовательно, именно здесь темпы роста эксплуатационных расходов в процессе
старения оборудования будут максимальными среди всех цехов.
Выводы
) Самое изношенное оборудование во втором цехе, наиболее высоки
эксплуатационные расходы в третьем цехе.
) Наиболее тесная связь между возрастом оборудования и эксплуатационными
расходами наблюдается в третьем цехе, что подтверждается значениями
коэффициентов Фехнера (0,943) и коэффициента корреляции (0,975). Наименее
тесная связь в первом цехе, что также подтверждается значениями этих
коэффициентов (0,771 и 0,963, соответственно).
) В четвертом цехе наблюдаются максимальные темпы роста эксплуатационных
расходов в процессе старения оборудования среди всех цехов.