Статистичне дослідження

Вид работы:

Курсовая работа (т)
Предмет:

Эктеория
Язык:

Украинский
,
Формат файла:
MS Word

323,1 Кб
Опубликовано:

2012-11-30

Все курсовые работы по экономической теории

Скачать курсовую работу Читать текст online Заказать курсовую
*Помощь в написании! Посмотреть все курсовые работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Статистичне дослідження

Вступ

Статистика - це наука, яка вивчає кількісну сторону масових суспільних, соціально-економічних та інших явищ в нерозривному зв'язку з їх якісною стороною в певних умовах місця і часу.

Отже, предмет статистики - кількісна сторона масових суспільних, соціально-економічних та інших явищ в нерозривному зв'язку з їх якісною стороною в певних умовах місця і часу.

Об'єктом статистики є людське суспільство, явища і процеси суспільного життя.

Особливості статистики:

) статистика говорить мовою цифр, але ці цифри якісно визначені;

) масовість явищ (статистика не вивчає поодинокі явища, оскільки в них не проявляються закономірності, які досліджуються статистикою); використовується математичний закон великих чисел, основним принципом якого є те, що закономірність масових явищ може проявлятися при достатньо великому числі випадків;

) статистика вивчає структуру явища і його динаміку;

) статистика вивчає явища в їх взаємозв'язку.

Закономірності проявляються в таких своїх різновидах:

) закономірності розвитку (динаміка явищ);

) закономірності структурних зрушень;

) закономірності розподілу елементів сукупності (розподіл населення за віком, за статтю);

) закономірності співзалежності (зв'язку між явищами).

Статистична сукупність - це маса однорідних в певному відношенні елементів, мають єдину якісну основу, але різняться між собою певними ознаками і підлягають певному закону розподілу.

Статистична сукупність - це певна множина елементів, поєднана умовами існування і розвитку.

Сукупність може бути однорідною і різнорідною.

Однорідна сукупність - якщо одна чи декілька ознак, що вивчаються, є загальними для всіх одиниць. Різнорідна сукупність об'єднує явища різного типу.

Сукупність складають окремі елементи, які називаються одиницями сукупності.

Одиниця сукупності - це первинний елемент статистичної сукупності, який є носієм ознак, що підлягають реєстрації і є основою обліку. Ознака - властивість окремої одиниці сукупності. Ознаки можуть бути (за характером виявлення) якісними і кількісними.

Якісні ознаки (атрибутивні ознаки) виражаються в вигляді понять, визначень, які характеризують їх суть, стан або якість. Наприклад, сорт продукції, професія, сімейний статус.

Кількісні ознаки виражають окремі значення якісних ознак у числовому виразі, окремі значення яких називаються варіантами.

Кількісні варіанти за характером виразу можуть бути первинними і вторинними.

Первинні варіанти - характеризують одиницю сукупності в цілому: абсолютні значення, вимірені, розраховані.

Вторинні варіанти (похідні, розрахункові) - дані, що не можливо перевірити тому що вони взяті з певних джерел.

По відношенню до об'єкту кількісні ознаки можуть бути прямими і непрямими. Прямі - характеризують об'єкт дослідження безпосередньо (вік осіб, кількість присутніх в аудиторії). Непрямі - ознаки, що не належать безпосередньо досліджуваному об'єкту (чи сукупності), а які належать іншій сукупності, що входить в дану.

За характером варіації кількісні ознаки можуть бути дискретними (перервні), безперервними; а якісні - багатоваріантними, альтернативними. Дискретні - ознаки, виражені окремими цілими числами, без проміжних значень. Безперервні - ознаки, що можуть набувати будь-яких значень у певних чисел. Багатоваріантні - перш за все характеризуються рангами (шкалою рангів) від більшого до меншого (напр. дуже низький, низький, середній, високий, дуже високий). Альтернативні - взаємовиключаючі значення: так-ні, позитивне-негативне.

По відношенню до часу ознаки можуть бути інтервальні і моментні. Інтервальні - це ознаки, які характеризують результат процесів. Моментні - характеризують об'єкт в певний момент часу.

В залежності між зв'язку між ознаками вони бувають факторними і результативними. Та ознака, яка впливає на іншу, називається факторною. Та ознака, яка підлягає впливу, називається результативною. Наприклад: від рівня кваліфікації робітника залежить його продуктивність. Тут кваліфікація робітника є факторною ознакою, а продуктивність - результативна. В свою чергу від продуктивності залежить заробітна плата. Тут продуктивність вже стала факторною ознакою, а заробітна плата - результативна.

Методологічною основою статистики є:

) теорія пізнання, яка визначає наукові підходи до вивчення явищ природи і суспільства;

) діалектична логіка, загальнонаукові прийоми синтезу і аналізу;

) системний підхід;

) основи економічної теорії;

) специфічні, властиві лише статистиці, методи (статистичне групування, зведення і групування, середні, узагальнюючі і аналітичні показники, індекси, вибірковий метод, балансовий метод, регресійно-кореляційний метод і т.д.).

Будь-яке статистичне дослідження має 4 етапи (всі вони об'єднуються єдиним - метою дослідження):

) статистичне спостереження - збір даних шляхом первинного (вимірення, опитування, підрахування) або вторинного збору;

) зведення і групування даних та результатів спостережень;

) узагальнюючі показники (можуть бути абсолютні, середні і відносні);

4) аналіз.

Функції статистики:

) пізнавальна функція - статистика вивчає кількісне співвідношення і взаємозв'язки, встановлює закономірності розвитку;

) контрольно-організаційна функція;

) керуюча функція - на основі наявних даних проводиться планування і керування.

Завданнями статистики відповідно до Закону України "Про державну статистику" є (мається на увазі державна статистика):

реалізація державної політики в галузі статистики;

збирання, розробка, узагальнення та всебічний аналіз статистичної інформації про процеси, що відбуваються в економічному і соціальному житті України та її регіонів;

розробка і впровадження статистичної методології, яка базується на результатах наукових досліджень, міжнародних стандартах та рекомендаціях;

забезпечення достовірності, об'єктивності, оперативності, стабільності та цілісності статистичної інформації;

забезпечення доступності, гласності і відкритості зведених статистичних даних в межах чинного законодавства.

статистичний варіація кореляційний ряд

1. Статистичний метод групування

У результаті статистичного спостереження отримують матеріал, який характеризує окремі елементи сукупності. Постає потреба у спеціальній обробці статистичних даних - зведенні матеріалів спостереження.

Статистичне зведення - це упорядкування, систематизація і наукова обробка статистичних даних. Воно включає такі основні етапи:

групування матеріалу;

розробку системи показників для характеристики типових груп і підгруп;

підбиття групових і загальних підсумків, оформлення результатів у вигляді таблиць.

Статистичне групування - утворення однорідних груп одиниць сукупності за першою суттєвою ознакою, а також тих, що мають однакові або близькі значення групової ознак, яку взято за основу утворення груп у процесі групування. За допомогою статистичного групування розв’язують три основних завдання:

- поділ неоднорідної сукупності на якісно однорідні групи або виокремлення соціально-економічних типів - типологічні групування;

- вивчення складу однорідної сукупності за різними ознаками - структурні групування;

виявлення та вивчення взаємозв’язку явищ та їх ознак - аналітичні групування.

Групування за однією ознакою називають простими. Якщо ж для виокремлення груп беруть по дві і більше ознак, то такі групування називають комбінованими.

Класифікація (у статистиці) - це систематизований розподіл явищ і об’єктів на групи, класи, розряди на основі їх схожості або відмінностей.

В аналітичних групуваннях здебільшого застосовують кількісні ознаки. У групуваннях за кількісними ознаками постає питання про кількість груп і величину інтервалу.

Величина інтервалу - це різниця між максимальним та мінімальним значеннями ознаки в кожній групі.

Інтервали можуть бути рівними і нерівними. Рівні інтервали застосовуються тоді, коли ознака групування розподілена в сукупності більш-менш рівномірно. Величину рівних інтервалів (h) визначають за формулою

де Х_тах> Х_тіп ^_ значення ознаки в сукупності відповідно максимальне і мінімальне;

К-кількість груп.Кількість груп залежить від обсягу сукупності. Якщо сукупність велика, то кількість груп за рівних інтервалів можна визначити за формулою, яку запропонував американський вчений Стерджес:

де N - кількість одиниць сукупності.

Іноді при невеликій кількості спостережень застосовують принцип рівних частин. За такого принципу одиниці сукупності розташовуються у порядку зростання, а в кожній групі міститься однакова їх кількість. Це виключає утворення численних груп.

В окремих випадках здійснюють перегрупування даних з метою утворення нових груп на основі наявних, якщо останні не задовольняють меті аналізу.

У результаті групування отримують ряди розподілу.

Ряди розподілу - це сукупність значень групової ознаки (варіант) та відповідних частот (часток).

Варіанти - це окремі значення групувальної ознаки, а частоти - числа, які показують, скільки разів окремі значення варіант повторюються в ряді розподілу. Замість частот може бути частка, виражена коефіцієнтом або відсотком. Накопичену частоту (частку) називають кумулятивною.

Залежно від статистичної природи групувальної ознаки розрізняють атрибутивні та варіаційні ряди розподілу.

В атрибутивних рядах одиниці сукупності розподіляються за атрибутивними (якісними) ознаками, у варіаційних рядах - за кількісними ознаками.

Варіаційні ряди можуть бути дискретними або інтервальними. Характер варіаційного ряду визначається характером варіації. Варіація може бути дискретною (перервною) або неперервною.

Дискретними називають ряди розподілу, у яких варіанти є цілими числами.

Інтервальними називають ряди розподілу, в яких варіанти мають вигляд інтервалів.

У результаті статистичного спостереження ми отримали матеріал по цукровим заводам в кількості 20 підприємств. Спостереження велося за такими критеріями:

- вартість основних фондів, тис. грн.

- валова продукція, тис. грн.

- середньоспискова чисельність працівників, чол.

- в тому числі робітників, чол.

- перероблено цукросировини, тис. ц.

- вироблено цукру, тис. ц.

середньодобова переробка буряків, тис.

Таблиця 1 - Дані завдання.

№ п/п	Вартість осн фондів, тис. грн	Валов. Прод. Тис. грн	Середспискова чисел працівн. чол	В т.ч. робітників, чол..	Перероб. цукросир. Тис.ц	Виробл. цукру, тис.ц	Середньодобова перероб. буряків
4	10097	7249	883	789	1528	166	18
5	8097	5256	433	359	938	120	10,7
6	11116	14090	839	724	1253	158	12
7	4880	3525	933	821	1385	171	14,2
8	7355	5431	526	428	818	101	12,1
9	10066	7680	676	607	1353	154	20,8
10	7884	8226	684	619	1425	188	21
11	7038	4081	1291	1196	1688	196	20,7
12	4850	10473	556	492	1943	244	18,5
13	4350	6097	496	438	1248	134	17,1
14	3427	5307	367	311	1101	122	12,4
15	6062	7400	706	625	1470	169	21,3
16	6113	7079	555	491	1189	165	18,4
17	9787	6339	623	556	1202	139	22,1
18	3849	1544	371	314	285	33	10,7
19	10826	11430	977	886	2082	256	45,3
2О	6695	4105	738	639	1297	172	16,9
21	6633	13366	922	917	1104	145	17,7
22	6472	6340	495	416	1138	142	20,6
23	6083	3624	456	403	552	84	13,9

Для подальших розрахунків необхідно виконати первинне групування вихідних даних за основною ознакою - валова продукція. Так як групування проводимо по одній ознаки, то воно у нас вважається простим.

Таблиця 2 - Сортування (впорядкування) даних.

№ п/п	Валов. прод. Тис. грн	Вартість осн. фондів, тис. грн	Серед. спискова чисел працівн. чол	В т.ч. робітників, чол	Перероб. цукросир. тис.ц	Виробл. цукру, тис.ц	Середньодобова перероб, буряків
18	1544	3849	371	314	285	33	10,7
7	3525	4880	933	821	1385	171	14,2
23	3624	6083	456	403	552	84	13,9
11	4081	7038	1291	1196	1688	196	20,7
2О	4105	6695	738	639	1297	172	16,9
5	5256	8097	433	359	938	120	10,7
14	5307	3427	367	311	1101	122	12,4
8	5431	7355	526	428	818	101	12,1
13	6097	4350	496	438	1248	134	17,1
17	6339	9787	623	556	1202	139	22,1
22	6472	495	416	1138	142	20,6
16	7079	6113	555	491	1189	165	18,4
4	7249	10097	883	789	1528	166	18
15	7400	6062	706	625	1470	169	21,3
9	7680	10066	676	607	1353	154	20,8
10	8226	7884	684	619	1425	188	21
12	10473	4850	556	492	1943	244	18,5
19	11430	10826	977	886	2082	256	45,3
21	13366	6633	922	917	1104	145	17,7
6	14090	11116	839	724	1253	158	12

Визначаємо кількість груп за формулою Стерджес:

- кількість підприємств дорівнює 20.

Отже, кількість груп 6.

Визначаємо крок інтервалу:

Межі груп мають такі інтервали

1544	3635
3635	5726
5726	7817
7817	9908
9908	11999
11999	14090

Після визначення інтервалів групування, побудуємо таблицю допоміжного групування.

Таблиця 3 - Допоміжна таблиця групування

№ п/п	Валов. прод. Тис. грн	Вартість осн. фондів, тис. грн..	Серед. спискова Чисел. працівн. чол	В т.ч. робітників, чол	Перероб. цукросир. Тис.ц	Виробл. цукру, тис.ц	Середньодобова перероб, буряків
18	1544	3849	371	314	285	33	10,7
7	3525	4880	933	821	1385	171	14,2
23	3624	6083	456	403	552	84	13,9
Σ	8693	14812	1760	1538	2222	288	38,8
11	4081	7038	1291	1196	1688	196	20,7
2О	4105	6695	738	639	1297	172	16,9
5	5256	8097	433	359	938	120	10,7
14	5307	3427	367	311	1101	122	12,4
8	5431	7355	526	428	818	101	12,1
Σ	24180	32612	2064	1737	4154	515	52,1
13	6097	4350	496	438	1248	134	17,1
17	6339	9787	623	556	1202	139	22,1
22	6340	6472	495	416	1138	142	20,6
16	7079	6113	555	491	1189	165	18,4
4	7249	10097	883	789	1528	166	18
15	7400	6062	706	625	1470	169	21,3
9	7680	10066	676	607	1353	154	20,8
Σ	48184	52947	4434	3922	9128	1069	138,3
10	8226	7884	684	619	1425	188	21
Σ	8226	7884	684	619	1425	188	21
12	10473	4850	556	492	1943	244	18,5
19	11430	10826	977	886	2082	256	45,3
Σ	21903	15676	1533	1378	4025	500	63,8
21	13366	6633	922	917	1104	145	17,7
6	14090	11116	839	724	1253	158	12
Σ	27456	17749	1761	1641	2357	303	29,7

Для зручності зробимо підсумкову таблицю первинного групування.

Таблиця 4 - Підсумкова таблиця первинного групування

Номер групи	Межа інтервалуа	Середина інтервала	Валов. прод. тис. грн	Вартість осн фондів, тис. грн	Середспискова чисел працівн. чол	В тч робітників, чол	Перероб. цукросир. тис.ц	Виробл. цукру, тис.ц	Середньодобова Перероб. буряків
1	1544-3635	2589,5	8693	14812	1760	1538	2222	288	38,8
2	3635-5726	4680,5	24180	32612	2064	1737	4154	515	52,1
3	5726-7817	6771,5	52947	4434	3922	9128	1069	138,3
4	7817-9908	8862,5	8226	7884	684	619	1425	188	21
5	9908-11999	10953,5	21903	15676	1533	1378	4025	500	63,8
6	11999-14090	13044,5	27456	17149	1761	1641	2357	303	29,7
			138642	141080	12236	10835	23311	2863	343,7

Таблиця 5 - Ряд розподілу

Номер групи	Межа інтервала	Середина інтервала	Частота	Частка	Накопичена частка	Відносна щільність
1	1544-3635	2589,5	3	0,15	3	0,000072
2	3635-5726	4680,5	5	025	8	0,00012
3	5726-7817	6771,5	7	0,35	15	0,00017
4	7817-9908	8862,5	1	0,05	16	0,000024
5	9908-11999	10953,5	2	0,1	18	0,000048
6	11999-14090	13044,5	2	0,1	20	0,000048

У даній таблиці варіанта - середина кожного інтервального ряду, беремо з попередніх розрахунків. Частота показує кількість підприємств, що входять в кожен інтервал. Частку знаходимо за формулою:

де f - відповідна частота групи;- загальна кількість підприємств.

Накопичена частота - це сума частот:

відносна щільність:

де f - відповідна частота;- крок інтервалу.

За сформованим рядом розподілу будуємо статистичні графіки. Статистичний графік - спосіб наочного подання і викладання даних за допомогою геометричних знаків та інших графічних символів з метою їх узагальнення і аналізу.

Полігон розподілу - графічне зображення варіаційного ряду в системі координат у вигляді ламаної, що послідовно з’єднує точки. По осі абсцис відкладається значення варіант, по осі ординат - частоти.

Рисунок 1 - Полігон розподілу

Гістограма - найпоширеніший вид графічного зображення інтервальних рядів. Вона будується за відносною щільністю у вигляді прямокутників так, щоб площа їх дорівнювала 1.

Рисунок 2 - Гістограма

Кумулята - графічне порівняння двох або більше варіаційних розподілів з рівними чи нерівними інтервалами. Вона будується за кумулятивним розподілом накопичених частот, при цьому використовуються праві кінці інтервалів.

Рисунок 3 - Кумулята

Огіва - це різновид кумулятивного розподілу. Вона є дзеркальним відображенням кумуляти. На осі ординат відкладаємо межі інтервалів, по осі абсцис - накопичені частоти.

Рисунок 4 - Огіва

2. Середні величини та показники варіації

Найважливішою характеристикою варіаційного ряду розподілу є середня величина, яка здатна відображати характерний рівень ознаки притаманний усім елементам сукупності.

Статистичні середні відображають активну наявність певних умов, що проявляються в кожній одиниці досліджуваної сукупності; вони дають узагальнюючу кількісну характеристику статистичним сукупностям однотипних явищ за варіаційною ознакою.

Середньою величиною в статистиці називаються кількісні показники характерного, типового рівня масових однорідних явищ, який складається під впливом загальних причин і умов розвитку. В зв’язку з цим середні величини належать до узагальнюючих статистичних показників, які дають зведену, підсумкову характеристику масових суспільних явищ. У середній величині гасяться (розчиняються) всі відмінності та особливості індивідуальних значень ознак, і вона є «рівнодіючою» значень цих ознак. Розрахунок середніх передбачає обов’язковість урахування умов виникнення кожної індивідуальної величини, інакше обчислення можуть призвести до фіктивних середніх. Щоб середня величина відображувала типове і загальне для всієї сукупності, остання повинна бути якісно однорідною.

Середня арифметична - застосовують тоді, коли обсяг варіюючої ознаки для сукупності є сумою індивідуальних значень її окремих елементів.

Середня гармонійна - застосовують тоді, коли відсутні безпосередні дані про вагу, а відомі варіанти ознак, що усереднюються (х), і добутки значень варіантів на кількість одиниць, які мають значення . Розраховують на основі зворотних значень ознаки.

Середня геометрична - застосовується тоді, коли визначальна властивість сукупності формується як добуток індивідуальних значень ознаки (аналіз динаміки для визначення середнього темпу зростання).

де Π - символ добутку;

х_і - відносні величини динаміки;

Σ¹_nj = n_i - часовий інтервал.

Середня квадратична - використовують у розрахунку показників віріації.

Ми використовуємо середню арифметичну зважену:

Таблиця 6 - Розрахунок середніх величин

Номер п/п	Середина інтервала (х)	Частота f	xf	(x-)²
1	2589,5	3	7768,5	17489124
2	4680,5	5	23402,5	4372281
3	6771,5	7	47400,5	0
4	8862,5	1	8862,5	4372281
5	10953,5	2	21907	17489124
6	13044,5	2	26089	39350529
Сума		20	135430	83073339
середнє			6771,5	4153667

Структурні середні величини

У ряді розподілу важливе значення мають структурні середні величини, які характеризують структуру аналізованих сукупностей - мода і медіана.

Мода (М₀) - варіанта, що найчастіше повторюється в ряді розподілу і розраховується за формулою:

де Х₀ - нижня межа модального інтервалу;- величина модального інтервалу;_Mo - частота модального інтервалу;_Mo-1 - частота попереднього інтервалу;_Mo+1 - частота інтервалу, наступного за модальним.

Медіана (М_е) - варіанта, що ділить ранжований ряд на дві рівні частини і розраховується за формулою:

де Х_Ме- нижня межа медіанного інтервалу;- величина медіанного інтервалу;

- півсума частот медіанного інтервалу;

- сума частот перед медіанним інтервалом;

- частота медіанного інтервалу.

Основні показники варіації

Середні величини характеризують рівень однорідних масових явищ і процесів, але не дають ніякого уявлення про коливання ознаки, тому середні величини доповнюють показниками варіації. Вимірювання степеня коливання ознаки, її варіації - невід’ємна складова аналізу закономірностей розподілу.

Варіація будь-якої ознаки формується під впливом двох причин (факторів):

основна, що наявна і тісно пов`язана з природою самого явища;

другорядна - випадкова для цієї сукупності в цілому.

Середні величини характеризують типовий рівень варіюючої ознаки. Крім даних характеристик, обчислюються ще й наступні:

Розмах варіації - Являє собою різницю між максимальною і мінімальною варіацією.

Середнє лінійне відхилення - це сума, або зважена сума абсолютних величин відхилень варіант від середнього значення.

Основною характеристикою варіацій є дисперсія, за допомогою якої оцінюється відхилення варіаційної ознаки від середнього арифметичного.

Недоліком дисперсії є те, що вона завжди представлена у квадраті, що не придатне для аналізу. Тому дисперсія має недолік - одиницю виміру. Щоб ліквідувати цей недолік, розраховується:

Середнє квадратичне відхилення:

При порівнянні варіації різних ознак або однієї ознаки в різних сукупностях використовуються коефіцієнти варіації:

а) - лінійний;

б) - квадратичний;

в) - осциляції.

Таблиця 7 - Показники варіації

варіанти	частоти	розрахунки
X_i	f_i	X_if_i	\|X_i-\|\|X_i-\|f_i(X_i-)²(X_i-)²f_i
2589,5	3	7768,5	4182	12546	17489124	52467372
4680,5	5	23402,5	2091	10455	4372281	21861405
6771,5	7	47400,5	0	0	0	0
8862,5	1	8862,5	2091	2091	4372281	4372281
10953,5	2	21907	4182	8364	17489124	34978248
13044,5	2	26089	6273	12546	39350529	78701058
Сума	20	135430		46002	83073339	192380364
середнє		6771,5		2300,1	4153667	9619018,2

Згідно розрахунків із таблиці 7 знаходимо:

= 2300,1

= 9619018,2

лінійний коефіцієнт варіаціїї

=(2300,1/6771,5)·100% = 33,97%

квадратичний коефіцієнт варіації

=(3101,45/6771,5)·100% = 45,8%

- коефіцієнт варіації оселяції

= (10455/6771,5)·100% = 154,4%

. Кореляційний аналіз

Кореляцією називається неповний зв’язок між досліджуваними явищами. Це така залежність, коли будь-якому значенню однієї змінної величини може відповідати декілька різноманітних значень іншої змінної величини. Вона відображає закон множини причин і наслідків і є вільною неповною залежністю.

Модель кореляційно-регресійного аналізу (лінійної регресії) є найбільш розповсюдженою регресійною моделлю. По-перше, вона приваблює своєю простотою, тому що немає простіше функції, ніж лінійна (рівняння прямої лінії). По-друге, при лінійній апроксимації легко вдається одержати мінімальну середньоквадратичну помилку.

У кореляційно-регресивному аналізі оцінювання лінії регресії для добавлення ряду «лінія регресії» здійснюється не в окремих точках, як в аналітичному групуванні, а в кожній точці інтервалу зміни факторної ознаки х. Тобто лінія регресії в цьому випадку безперервна і зображується у вигляді певної функції, яка називається рівнянням регресії, а У- це теоретичні значення результативної ознаки.

Парною лінійною регресією Y на X називається одностороння стохастична залежність між випадковими величинами показника Y і фактора X, які знаходяться у причиново-наслідкових відношеннях, причому зміна фактора викликає пропорціональну зміну показника.

Нехай ми маємо набір значень двох змінних x_i, y_i, i=1,…,n. Пари (x_i,y_i) можна зобразити точками на площині X-Y:

Уведемо гіпотезу, що між показником Y і фактором X існує стохастична лінійна залежність. Суть задачі полягає в тому, щоб знайти (підібрати, підігнати) лінію, яка найкраще описує залежність Y від X.

Модель лінійної регресії є, власне кажучи, лінійною апроксимацією (наближенням) реальної лінії регресії y(x). Вона описується рівнянням прямої

де множник а₁ називається коефіцієнтом регресії. Пряма повинна проходити так, щоб стосовно крапок вибірки

{X_i,Y_i}⁽ⁿ⁾={ (x₁,y₁)_, (x₂,y₂)_,…(x_n,y_n)}

забезпечити мінімальне квадратичне відхилення. Для кожної крапки вибірки помилка результативної ознаки дорівнює

Ця модель є найбільш розповсюдженою регресійною моделлю. По-перше, вона залучає своєю простотою, оскільки немає простіше функції, ніж лінійна (рівняння прямої лінії). По-друге, при лінійній апроксимації легко вдається одержати мінімальну середньоквадратичну помилку.

Модель лінійної регресії є, власне кажучи, лінійною апроксимацією (наближенням) реальної лінії регресії y(x). Вона описується рівнянням прямої, де множник а називається коефіцієнтом регресії. Пряма (6.2) повинна проходити так, щоб стосовно крапок вибірки

{X_i,Y_i}⁽ⁿ⁾={ (x₁,y₁)_, (x₂,y₂)_,…(x_n,y_n)}

забезпечити мінімальну СКО. Для кожної крапки вибірки помилка

результативної ознаки дорівнює

Середній квадрат помилки апроксимації пропорційний сумі квадратів помилок

(a,b)=n^-1S_ie_i²=n^-1S_i(a₁x_i+а₀-y_i)²

Визначення параметрів a і b моделі здійснюється методом найменших квадратів (МНК). Тому що мінімум функції Е при варіації a і b має місце в крапці нульових часток похідних, то одержимо систему двох лінійних відносно a і b рівнянь.

Ця система носить назву система нормальних рівнянь.

Рішення системи рівнянь має вигляд

Знаменники в цих вираженнях пропорційні дисперсії факторної ознаки

а чисельник пропорційний моменту кореляції між ознаками X і Y.

Тут використана властивість незміщеності оцінок x та y. З урахуванням співвідношень коефіцієнт регресії можна виразити як

Після визначення a₁ для розрахунку a₀ зручніше скористатися формулою:

Вибираючи формулу кореляційного зв’язку, насамперед виходять з економічної природи явищ, простоти аналітичної функції і вимог до обмеженої кількості параметрів.

Рівняння кореляційного зв’язку є аналітичним. За його допомогою відображається взаємозв’язок ознак, а саме залежність між варіаціями результативної і факторної ознак.

Найчастіше використовують такі рівняння:

- прямої лінії ;

- гіперболи ;

- параболи другого порядку ;

- експоненти .

де у - значення результативної ознаки, що залежить тільки від факторної;

х - значення факторної ознаки;

а₀, а₁, а₂ - сталі величини, які називаються параметрами рівняння.

Аналітичне рівняння кореляційного зв’язку і його параметри визначають методом найменших квадратів, використовуючи систему нормальних рівнянь. Так, для прямої лінії використовують таку систему нормальних рівнянь:

Таблиця 8 - Кореляційно-регресійний аналіз

Факторна ознака, х	Результативна ознака, у	х*у	х²	у²	Х-Х_сер	(Х-Х_сер)²	У-У_сер	(У-У_сер)²
7249	10097	73193153	52548001	101949409	316,9	100425,61	3013	9078169
5256	8097	42557832	27625536	65561409	-1676,1	2809311,21	1013	1026169	11116	156624440	198528100	123565456	7157,9	51235532,4	4032	16257024
3525	4880	17202000	12425625	23814400	-3407,1	11608330,4	-2204	4857616
5431	7355	39945005	29495761	54096025	-1501,1	2253301,21	271	73441
7680	10066	77306880	58982400	101324356	747,9	559354,41	2982	8892324
8226	7884	64853784	67667076	62157456	1293,9	1674177,21	800	640000
4081	7038	28722078	16654561	49533444	-2851,1	8128771,21	-46	2116
10473	4850	50794050	109683729	23522500	3540,9	12537972,8	-2234	4990756
6097	4350	26521950	37173409	18922500	-835,1	697392,01	-2734	7474756
5307	3427	18187089	28164249	11744329	-1625,1	2640950,01	-3657	13373649
7400	6062	44858800	54760000	36747844	467,9	218930,41	-1022	1044484
7079	6113	43273927	50112241	37368769	146,9	21579,61	-971	942841
6339	9787	62039793	40182921	95785369	-593,1	351767,61	2703	7306209
1544	3849	5942856	2383936	14814801	-5388,1	29031621,6	-3235	10465225
11430	10826	123741180	130644900	117202276	4497,9	20231104,4	3742	14002564
4105	6695	27482975	16851025	44823025	-2827,1	7992494,41	-389	151321
13366	6633	88656678	178649956	43996689	6433,9	41395069,2	-451	203401
6340	6472	41032480	40195600	41886784	-592,1	350582,41	-612	374544
3624	6083	22044792	13133376	37002889	-3308,1	10943525,6	-1001	1002001
138642	141680	1054981742	1165862402	1105819730		204782194		102158610
6932,1	7084	52749087,1

Для знаходження невідомих параметрів складаємо систему нормальних рівнянь використовуючи дані таблиці:

Звідси знаходимо шукані величини:

а₀ = 4588,4

а₁ = 0,36

Отримавши потрібні параметри, складаємо рівняння, за допомогою якого знаходимо теоретичне значення допоміжної ознаки Y:

ГРАФІК

Рисунок 5 - Відображає зв'язок між факторною і результативною ознаками

Знайдемо загальну, залишкову та факторну суми квадратів і перевіримо правильність складання таблиці.

Таблиця 9

Дані величини		Розрахункові величини
Х	У	(У-)²(-У_сер)²
7249	10097	7198,04	8403969,082	13005,1216
5256	8097	6480,56	2612878,274	364139,8336
14090	11116	9660,8	2117607,04	6639898,24
3525	4880	5857,4	955310,76	1504547,56
5431	7355	6543,56	658434,8736	292075,3936
7680	10066	7353,2	7359283,84	72468,64
8226	7884	7549,76	111716,3776	216932,3776
4081	7038	6057,56	961262,5936	1053579,074
10473	4850	8358,68	12310835,34	1624809,102
6097	4350	6783,32	5921046,222	90408,4624
5307	3427	6498,92	9436692,486	342318,6064
7400	6062	7252,4	1417052,16	28358,56
7079	6113	7136,84	1048248,346	2792,0656
6339	9787	6870,44	8506322,234	45607,8736
1544	3849	5144,24	1677646,658	3762668,858
11430	10826	8703,2	4506279,84	2621808,64
4105	6695	6066,2	395389,44	1035916,84
13366	6633	9400,16	7657174,466	5364597,146
6340	6472	6870,8	159041,44	45454,24
3624	6083	5893,04	36084,8016	1418385,722
138642	141680	141679,12	76252276,28	26539772,36

Перевірка

Похибка

Знаходимо загальну, залишкову та регресійну дисперсію, а також перевіримо адекватність рівняння регресії:

- залишкова.

- кількість невідомих параметрів у рівнянні, дорівнює 2.

- факторна

Для перевірки адекватності рівняння регресії застосуємо критерій Фішера:

обчислюємо спостирежувальне значення критерія

за таблицею знаходимо критичне (табличне) значення

порівняння F_cn>F_kp (6,26>4,41) - немає підстав відхилити тестуючу гіпотезу, тобто вона є адекватною.

Оцінка щільності зв´язку

Оцінка щільності зв’язку - це характеристика ступеня залежності між ознаками. Показниками щільності зв’язку є коефіцієнти парної, часткової і множинної кореляції та детермінації, рангові коефіцієнти, коефіцієнти асоціації, взаємної спряженості та ін.

Вибір відповідного коефіцієнта залежить від виду випадкової величини, форми їх залежності, закону розподілу. Для оцінки суттєвості зв’язку використовують критерій значущості.

Найчастіше використовують лінійний коефіцієнт кореляції, який обчислюється за формулою (модифікація):

σ - середнє квадратичне відхилення.

Використовуються також такі формули:

; ; .

Коефіцієнт r змінюється в межах ±1. Додатнє значення цього показника свідчить про прямий зв'язок. Що більше його значення, то щільніший зв'язок між у та х і навпаки. Отже, у нас додатнє значення коефіцієнта і тому маємо прямий зв'язок.

У літературі пропонуються різні оцінки коефіцієнта кореляції, але найчастіше застосовують такі оцінки:=0 зв’язок відсутній=0,1-0,3 зв’язок слабкий=0,3-0,5 зв’язок помірний=0,5-0,7 зв’язок суттєвий (середній)=0,7-0,9 зв’язок тісний (високий)=1 зв’язок функціональний.

Оскільки коефіцієнт лежить в межах 0,5 - 0,7, можемо зробити висновок, що зв'язок суттєвий.

Знаходимо коефіцієнт детермінації. Значення R² показує скільки відсотків варіації результативної ознаки у залежить від варіації факторної ознаки х.

Це означає, що 25% даних підпорядковані лінійній залежності.

Індекс кореляції:

У разі лінійної залежності R=|r|

,5 = 0,5 - умова виконується.

. Ряди динаміки

Динамічний ряд - це послідовність чисел, які характеризують зміну того чи іншого соціально-економічного явища у часі. Елементами динамічного ряду є перелік хронологічних дат (моментів) або інтервалів часу і конкретні значення відповідних статистичних показників, котрі називаються рівнями ряду (у).

При вивченні динаміки важливі не лише числові значення рівнів, а і їх послідовність. Як правило, часові інтервали між рівнями однакові (доба, декада, календарний місяць, квартал, рік). Узявши будь-який інтервал за одиницю, послідовність рівнів записуємо так: у₁, у₂, у₃,...,у_n.

Залежно від статистичної природи показника-рівня розрізняють динамічні ряди первинні й похідні, ряди абсолютних, середніх і відносних величин. За ознакою часу динамічні ряди поділяються на інтервальні та моментні. Рівень моментного ряду фіксує стан явища на певний момент часу t, наприклад, кількість працюючих на початок року, студентів - на 1 вересня. В інтервальному ряді рівень - це агрегований результат процесу, що залежить від тривалості часового інтервалу.

Динамічні ряди характеризуються низкою показників.

1 . Абсолютний приріст, тобто різниця двох рівнів ряду - наступного і попереднього:

базисний ;

ланцюговий ,

де y₀ y_i - відповідно початковий і кінцевий рівень ( y_i-1 - попередній рівень ряду).

. Коефіцієнт зростання - це відношення наступного рівня до попереднього:

базисний ;

ланцюговий .

3. Темп зростання - це процентне співвідношення двох рівнів ряду:

базисний ;

ланцюговий .

Темп зростання можна розрахувати, помноживши відповідний коефіцієнт зростання на 100:

Т = К * 100.

Темп приросту - це відношення абсолютного приросту до попереднього або першого рівня, виражене у відсотках:

ланцюговий (або К_i- 1).

5 . Абсолютна величина одного процента визначається як відношення абсолютного приросту до темпу приросту або діленням базисного чи попереднього рівня на 100:

базисний (або y_i/ 100);

ланцюговий (або y_i-1/ 100).

Оскільки показники ряду динаміки змінюються за роками, виникає необхідність їх узагальнення і розрахунку середніх показників.

Середній рівень інтервального ряду визначається за середньою арифметичною простою

У моментному ряді динаміки середній рівень визначається за середньою хронологічною

Середній абсолютний приріст знаходять як середню ланцюгових

абсолютних приростів

Середній коефіцієнт зростання розраховують за середньою геометричною

де К_i- ланцюгові коефіцієнти зростання, або за формулою

Середньорічний темп зростання:

Обрахування характеристики ряду динаміки

В якості досліджуваного ряду динаміки можна обрати ранжирования ряд основної ознаки.

Проведемо розрахунки показників ряду динаміки за основною ознакою - валова продукція.

Таблиця 9 - Розрахунок показників ряду динаміки

Період	Ріень ряду	Абсолютний приріст		Темп зростання		Темп приросту		Абсолютний вміст 1% приросту
		ланцюговий	базисний	ланцюговий	базисний	ланцюговий	базисний
t	y	∆_i=y_i-y_i-1	∆_i=y_i-y₀	T_p=(y_i/y_i-1)100%	T_p=(y_i/y₀)· 100%	T_np=T_p - 100%		\|A%\|=y_i/y_i-1
1	1544	-	-	-	-	-	-	-
2	3525	1981	1981	228,3	228,3	128,3	128,3	2,28
3	3624	99	2080	102,81	234,72	2,81	134,72	1,03
4	4081	457	2537	112,61	264,31	12,61	164,31	1,13
5	4105	24	2561	100,59	265,87	0,59	165,87	1,01
6	5256	1151	3712	128,04	340,41	28,04	240,41	1,28
7	5307	51	3763	100,97	343,72	0,97	243,72	1,01
8	5431	124	3887	102,34	351,75	2,34	251,75	1,02
9	6097	666	4553	112,26	394,88	12,26	294,88	1,12
10	6339	242	4795	103,97	410,56	3,97	310,56	1,04
11	6340	1	4796	100,02	410,62	0,02	310,62	1,0002
12	7079	739	5535	111,66	458,48	11,66	358,48	1,12
13	7249	170	5705	102,4	469,49	2,4	369,49	1,024
14	7400	151	5856	102,08	479,27	2,08	379,27	1,02
15	7680	280	6136	103,78	497,41	3,78	397,4	1,038
16	8226	546	6682	107,11	532,77	7,11	432,77	1,07
17	10473	2247	8929	127,32	678,3	27,32	578,30	1,27
18	11430	957	9886	109,14	740,28	9,14	640,28	1,091
19	13366	1936	11822	116,94	865,67	16,94	765,67	1,17
20	14090	724	12546	105,42	912,56	5,42	812,56	1,054
Σ	138642
y_сер	6932,1
∆у	660,3
Т_р	112,34
Т_пр	12,34

Оскільки показники ряду динаміки змінюються за періодами, то виникає необхідність їх узагальнення і розрахунку середніх показників. Середній рівень ряду визначається за середньою арифметичною простою, тобто

Отже, маємо

Середній абсолютний приріст

Середній темп зростання

Середній приріст

Розрахувавши середні показники ряду динаміки, ми можемо зробити висновок, що середній темп зростання - 112,34%, а середній темп приросту - 12,34%. Таким чином говоримо, що даний ряд динаміки проявляє тенденцію до збільшення на 12,34%.

Вирівнювання рядів динаміки

Вирівнювання рядів динаміки проводиться для виявлення тенденції (тренду).

При розрахунку п’ятичленної ковзаючої середньої кожен наступний інтервал утворюється на основі попереднього із заміною одного рівня.

; і т.д.

Середній темп зростання розраховується за допомогою коефіцієнта, який знаходиться за формулою середньої геометричної

Розрахований коефіцієнт множимо на перший рівень ряду Y1 та отримуємо середній рівень ряду Y2, помноживши даний Y2 на коефіцієнт K, отримуємо середній рівень ряду Y3 і т.д., поки не отримаємо Yn.

Таблиця 10 - Вирівнювання ряду динаміки методом укрупнення періодів і середньої плинної

Період	Рівень ряду	Метод укрупнення середніх	Розрахунки
			Середня ковзаюча	Середній темп зростання
1	1544	3375,8	3375,8	-
2	3525		4118,2	1729,28
3	3624		4474,6	3948
4	4081		4836	4058,88
5	4105		5239,2	4570,72
6	5256	5686	5686	4597,6
7	5307		5902,8	5886,72
8	5431		6257,2	5943,84
9	6097		6620,8	6082,72
10	6339		6881,4	6828,64
11	6340	7149,6	7149,6	7099,68
12	7079		7526,8	7100,8
13	7249		8205,6	7928,48
14	7400		9041,8	8118,88
15	7680		10235	8288
16	8226	11517	11517	8601,6
17	10473		9871,8	9213,12
18	11430		7777,2	11729,76
19	13366		5491,2	12801,6
20	14090		2818	14969,92

Ряд динаміки

Проведемо згладжування даного ряду за п´ятичленною середньою таблиці 10. Отримаємо вирівнювання ряду методом укрупнення періоду.

Проводимо вирівнювання також методом середньої плинної.

Для вирівнювання методом мінімальних квадратів або аналітичним методом побудуємо таблицю.

Таблиця 11 - Вирівнювання методом мінімальних квадратів

t²

1544

1932,9

3525

7050

2459,1

3624

10872

2985,3

4081

16324

3511,5

4105

20525

4037,7

5256

31536

4563,9

5307

37149

5090,1

5431

43448

5616,3

6097

54873

6142,5

6339

100

63390

6668,7

6340

121

69740

7194,9

7079

144

84948

7721,1

7249

169

94237

8247,3

7400

196

103600

8773,5

7680

225

115200

9299,7

8226

256

131616

9825,9

10473

289

178041

10352,1

11430

324

205740

10878,3

13366

361

253954

11404,5

14090

400

281800

11930,7

210

138642

2870

1805587

138636

Сума

6932,1

143,5

90279,35

6932,1

середні

Для побудови рівняння тенденцій або рівняння тренду виду скористаємося методом кореляційно-регресійного аналізу і знайдемо коефіцієнти а₀, а₁ з системи:

;

Для знаходження невідомих параметрів складаємо систему нормальних рівнянь використовуючи дані таблиці:

а₀+ 210а₁ = 138642

а₀ +2870а₁ = 1805587

Із даної системи рівнянь знаходимо шукані параметри а₀, а₁:

а₀ = 1406,7

а₁ = 526,2

Отримавши потрібні параметри, складаємо рівняння, за допомогою якого знаходимо теоретичне значення допоміжної ознаки Y.

Отже, маємо рівняння тренду

Аналітичне вирівнювання

. Індекси ряду

Цей метод широко використовується під час статистичного аналізу роботи підприємств, галузей усього народного господарства.

Індексний метод дає можливість визначити ступінь впливу окремих факторів на загальний результат.

Індекси - це відносні величини, які характеризують явище у розвитку, динаміці, часі і просторі. Індекси поділяються на індивідуальні та загальні.

Для розрахунку індивідуальних індексів необхідно величину одного елемента складного явища за один період віднести на його величину в другому періоді, прийнятому за базу для порівняння. У статистиці позначають кількість буквою q; ціну буквою Р; собівартість буквою Z; затрати часу на виробництво продукції буквою Т [або t].

Індивідуальні індекси визначаються такими формулами:

індекс фізичного обсягу i_q=q₁/q_0;

індекс цін i_р=р₁/р_0;

індекс собівартості i_z=z₁/z_0;

індекс трудомісткості i_t=t₁/t_0.

Загальні індекси показують співвідношення сукупності явищ, котрі складаються з різнорідних, безпосередньо не порівнюваних елементів. Загальний індекс розраховується за формулою

Це агрегатна формула індексів. Чисельник та знаменник тут приводять до порівняльного вигляду за допомогою таких сумірників, як ціна, собівартість, трудомісткість одиниці продукції.

У формулі 1 обсяг продукції в натуральних показниках, а ціна - в грошовій формі змінюється як у базисному, так і в звітному періоді, тому таку формулу називають агрегатний індекс перемінного складу.

Якщо зафіксувати ціну на продукцію на базисному рівні, одержимо індекс, який показує зміну тільки обсягу виробництва в базисних цінах

Такий індекс називають індексом фізичного обсягу виробленої продукції в порівняльних цінах.

Якщо зафіксувати обсяг виробництва продукції на рівні звітного періоду, а ціни змінювати в кожному періоді, то отримаємо індекс, котрий показує вплив цін на загальний індекс

. ( 3 )

Ці індекси зв’язані між собою

. ( 4 )

Щоб визначити вплив окремих факторів на результативний показник в абсолютних величинах, коли фактори співзалежні між собою, застосовуються формули

Абсолютний вираз, який характеризує зміну обсягу виробництва в грошовому вигляді у звітному періоді порівняно з базисним, має вигляд

Sq₁p₁-Sq₀p₀=Spq.

Щоб визначити вплив тільки обсягу виробництва, застосовують формулу підстановок

Dq= (q₁-q₀) .

Вплив ціни на абсолютний обсяг виробництва знаходимо за формулою

Dp=q⁰(p₁-p₀), звідси Dpq=Dq+Dp.

Співзалежні величини досить часто зустрічаються в статистичних розрахунках. Тому при аналізі це враховується, і вплив кожного фактора визначають за допомогою індексних систем.

Список використаної літератури

1. Фінансова статистика (з основами теорії статистики): Навч. посіб./ Головач А.В., Захожай В.Б. -К.:МАУП, 2002. - 224с.

2. Опря А.Т. Статистика. Математична статистика. Теорія статистики. Навчальний посібник. - Київ: Центр навчальної літератури, 2005. - 472с.

3. Методичні рекомендації та вихідні дані до контрольної роботи з дисципліни «Статистика» для слухачів центру післядипломної освіти економічних спеціальностей усіх форм навчання. - Полтава: ПолтНТУ, 2006. -33с.

Статистичне дослідження

Статистичне дослідження

Похожие работы на - Статистичне дослідження