Анализ динамических рядов и построение уравнения множественной регрессии

Вид работы:

Курсовая работа (т)
Предмет:

Эктеория
Язык:

Украинский
,
Формат файла:
MS Word

37,25 Кб
Опубликовано:

2015-01-17

Все курсовые работы по экономической теории

Скачать курсовую работу Читать текст online Заказать курсовую
*Помощь в написании! Посмотреть все курсовые работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Анализ динамических рядов и построение уравнения множественной регрессии

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

Санкт-Петербургский государственный горный университет

КУРСОВАЯ РАБОТА

по дисциплине Статистика

Тема работы: Анализ динамических рядов и построение уравнения множественной регрессии

ВЫПОЛНИЛ:

студент гр. БА-09-2 ____________ /Колодяжная Е.В./

ПРОВЕРИЛ:

Доктор техн. наук, профессор ___________ /Скобелина В.П./

Санкт-Петербург

2011

Министерство образования и науки Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

Санкт-Петербургский государственный горный университет

УТВЕРЖДАЮ

Заведующий кафедрой

_______ /Пашкевич Н. В./

" __" _______ 2011 г.

Кафедра экономики, учета и аудита

КУРСОВАЯ РАБОТА

По дисциплине: Статистика

ЗАДАНИЕ

Студенту группы БА-09-2 Колодяжной Е.В.

(шифр группы) (Ф.И.О.)

. Тема курсовой работы: Анализ динамических рядов и построение уравнения множественной регрессии

. Исходные данные к курсовой работе: В процессе написания курсовой работы было использовано 2 литературных источника.

. Содержание пояснительной записки: Курсовая работа включает решение комплексной статистической задачи построения уравнения множественной регрессии на конкретном информационном материале.

. Перечень графического материала: В качестве графического материала в курсовой работе представлено: 8 таблиц.

. Срок сдачи законченного проекта: 15 декабря 2011 г.

Руководитель проекта профессор ________________ / Скобелина В.П./

Дата выдачи задания: .

Аннотация

Целью курсовой работы является закрепление теоретических знаний, полученных при изучении курса «Общая Статистика». Работа включает решение комплексной статистической задачи построения уравнения множественной регрессии на конкретном информационном материале. Выполнение работы сопряжено с использованием знаний, теоретических обобщений и навыков практического их применения по высшей математике, общей теории статистики, элементам математической статистики, а также теоретическим основам отраслевой экономики.

The summary

object of course work is fastening of theoretical knowledge received at study the course «Statistics». The course work includes the decision of complex statistical problem by building equation of plural regression on specific information material. Performing of the work connects with using theoretical knowledge and skills of their practical using for mathematics, statistics, mathematical statistics and also theoretical bases of branch economy.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

. Качественный анализ таблицы исходных динамических рядов

.1 Исходные данные

.2 Анализ исходных динамических рядов признака-функции и признака-фактора

.3 Теоретические сведения о динамических рядах и их показателях

.4 Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами

. Расчет показателей вариации динамических рядов

.1 Исследование исходных динамических рядов на непрерывность

.2 Характеристика динамики признака-функции и признаков-факторов

.3 Представительность признаков

. Расчет показателей вариации динамических рядов

.1 Теоретическая справка о показателях вариации

.2 Расчет показателей вариации динамических рядов

. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции

.1 Теоретическая справка о парной корреляции

.2 Исследование коэффициентов парной корреляции

. Построение уравнение многофакторной корреляционной связи

.1 Теоретическая справка о множественной регрессии

.2 Построение уравнения множественной регрессии

Заключение

Список литературы

Приложение

Введение

Данная курсовая работа нацелена на решение комплексной статистической задачи, конечным итогом которой выступает уравнение множественной регрессии, построенное на конкретном информационном материале. Выполнение работы связано с использованием знаний по базовым теоретическим дисциплинам: высшей математике, общей теории статистики и теоретическим основам отраслевой экономики.

Курсовая работа имеет комплексный характер, следовательно, ее выполнение включает следующие этапы:

· проведение качественного анализа таблицы исходных данных динамических рядов;

· расчет показателей вариации динамических рядов и их оценка;

· проведение ранжирования признаков;

· количественное измерение тесноты связи между динамикой признака-функции и определенного числа признаков-факторов методом парной корреляции;

· построение уравнения многофакторной корреляционной связи признака-функции с наиболее значимыми признаками-факторами.

Каждый из перечисленных этапов решения данной задачи имеет свои конкретные вопросы, методы и способы их решения. Практически все работы выполняются при помощи специальной компьютерной программы «ELVIS».

1. Качественный анализ таблицы исходных динамических рядов

.1 Исходные данные

Исходная информация представлена таблицей, содержащей данные о плановых объемах механического колонкового бурения, дифференцированные по полезным ископаемым региона, полученные за 20 лет, при относительно постоянных внешних факторах для изучаемой совокупности (признака) за исследуемый период (таблица 1):

Таблица 1

Исходные данные

(метры)

1.2 Анализ исходных динамических рядов признака-функции и признака-фактора

Для того чтобы можно было сделать качественный анализ, нужно, чтобы исходная таблица отвечала следующим условиям:

· информация, находящаяся в таблице, должна быть однородной, то есть относиться к одному объекту изучения;

· данные таблицы должны быть сопоставимы;

· исходная информация представлена в единых измерениях.

Проведем проверку соответствия таблицы исходных данных (таблица 1) заданным параметрам. Однородность данной таблицы заключается в том, что все показатели таблицы относятся к одной территории, исходная информация представлена в едином измерении- метрах.

Особое место нужно уделить вопросу сопоставимости данных. Проблема сопоставимости данных важна для рядов динамики, потому что они охватывают значительные периоды времени, за которые могли произойти изменения, приводящие к несопоставимости статистических данных. Анализировать ряды динамики нельзя, если приводятся несопоставимые данные. В нашем случае геологоразведочные работы проводятся в одних и тех же территориальных границах, условия работы (рельеф, климатический пояс и т.д.) также постоянны, для механического колонкового бурения характерна достаточно устойчивая производственно-технологическая структура. То есть мы имеем динамические ряды с сопоставимыми уровнями.

В подлежащем таблицы исходного статистического материала находится динамический ряд обобщающего показателя (признак-функция) объема бурения (у), величина которого в любом году изучаемого периода (уровень признака-функции) зависит от уровня признака-фактора, показанного в сказуемом таблицы. Признаки-факторы содержат информацию об объемах бурения (у), на цветные металлы (х1), на черные металлы (х2), на неметаллы (х3) и из них на химическое сырье (х4). Таким образом, мы видим, что факториальные признаки формируют как внешнюю (объемы бурения всего, в том числе на цветные металлы, на черные металлы, на неметаллы), так и внутреннюю сводку (неметаллы, из них на химическое сырье).

Существование внешней и внутренней сводок подтверждают существование следующего неравенства:

(1.2.1)

Подставляя исходные данные получаем следующее неравенство:

793000

что подтверждает качественность информации, так как внутренняя сводка не должна превышать содержащую ее внешнюю.

1.3 Теоретические сведения о динамических рядах и их показателях

Из числа вариационных рядов выделяется особая их группа динамических рядов, уровни которых регистрируются моментами времени, а цифровые значения признака (признаков) жестко привязаны к временному вектору, т.е. у таких рядов постоянно увеличивается временной параметр, а значение признака (признаков) не подчинены какой-то определенной закономерности.

В силу этой особенности динамические ряды различаются по временному фактору:

· моментные динамические ряды, в которых регистрируются регулярно повторяющиеся моменты времени (декада, месяц, год);

· периодические ряды, уровни которых разделяются периодами времени (специализированными или стандартными);

· смешанные ряды, когда смешиваются моментные и временные уровни динамических рядов.

Временную особенность этих рядов можно проследить и в характеристике основных показателей динамических рядов. При этом следует помнить, что динамический ряд, как вариационный, имеет характеристики вариационного ряда (уровни, частоты и т.д.)

Специальные характеристики динамического ряда включают в себя:

· абсолютный прирост признака на данный момент времени по отношению к значению признака за постоянный момент (период) или переменный - соответственно базисные или цепные абсолютные приросты:

· относительный прирост, когда абсолютная разность относится к соответствующей базе постоянной или цепной:

· темп роста: цепной и базисный:

· темп прироста

Между базисными и цепными темпами роста существует взаимосвязь двоякого рода:

· если, начиная со второго, каждый последующий базисный темп разделить на предыдущий, получим цепной темп замыкающего уровня

· если перемножить несколько соседних (начиная с крайнего) значений цепных темпов роста, то получим базисный темп крайнего уровня

Кроме этих характеристик существует целая группа показателей - связок. К числу этих показателей относятся два наиболее распространенных стандартных показателя:

· квота абсолютного прироста признака на 1% его прироста равна частному от деления абсолютного прироста на темп роста

где Dti- темп прироста. Показатель темпа прироста дает относительную оценку значения абсолютного прироста по сравнению с первоначальным уровнем

· квота относительного изменения признака:

Несмотря на то, что второй показатель, считается более надежным его можно использовать только для расчетов по моментным рядам, а все остальные показатели можно считать для всех видов рядов. Однако, темпы роста (главным образом, цепные) у смежных рядов нужно уточнить. Рассмотренные показатели (кроме квот) - это уровневые показатели; для динамических рядов определяются и обобщающие показатели:

· итоговое базисное абсолютное отклонение признака от начальной базы:

· среднегодовой абсолютный прирост - это отношение полного абсолютного базисного прироста к числу моментов (периодов) динамических рядов

где n- число цепных абсолютных приростов в изучаемом периоде.

· среднегодовой темп роста:

где, ti - цепной темп роста, а n - число членов ряда.

Эта формула применима для замкнутых динамических рядов.

1.4 Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами

динамический ряд корреляция вариация

По характеру связи таблицы исходной информации делятся на три вида:

· балансовые, когда уровни признака-функции формируются из уровней признаков-факторов;

· аналитические, когда уровни признака-функции и уровни отдельных признаков-факторов связаны аналитически;

· комбинационные, когда уровни признака-функции связаны аналитически с несколькими признаками-факторами.

Балансовая связь между признаком-функцией и признаками-факторами в исходной таблице может быть полной, представительной и частичной.

В данном случае по характеру связи таблица исходной информации является балансовой, т.к. уровни признака-функции формируются из уровней признаков-факторов. Имеет место представительная балансовая связь, т.к. выполняется выражение:

где, i - индекс признака-фактора, i=1,2,…,n; m - число изучаемых признаков-факторов, mn, yt и xt - ежегодные уровни признака-функции и признака-фактора соответственно.

В нашем случае:

y- функциональный признак - объем бурения равен 3512600 метров

x1, x2, x3, x4-факториальные признаки, где x4 является внутренней сводкой x3

x1 - цветные металлы, 1519500 метров;

x2 - черные металлы, 346700 метров;

x3 - неметаллы, 1208800 метров;

x4 - химическое сырье, 793000 метров;

В нашем случае получили неравенство , которое удовлетворяет условиям формулы (1.4.17).

Таким образом, можно сделать вывод, что исходная информация качественная, следовательно, динамические ряды, ее формирующие, можно рассматривать как операционное поле последующего анализа.

Воспользуемся программой «ELVIS», исходная таблица может быть заменена матрицей:

Таблица 2

Исходные данные

--N------Y----------X1---------X2---------X3---------X4---

. 15500.0 7100.0 1450.0 5250.0 3700.0

. 15670.0 7150.0 1480.0 5510.0 3530.0

. 16010.0 7230.0 1520.0 5670.0 3690.0

. 16200.0 7280.0 1580.0 5710.0 3730.0

. 16800.0 7410.0 1610.0 5480.0 4300.0

. 16850.0 7450.0 1630.0 5620.0 4170.0

. 17170.0 7520.0 1670.0 5310.0 4670.0

. 17400.0 7800.0 1820.0 5750.0 4030.0

. 17750.0 7820.0 1740.0 5810.0 4380.0

. 17900.0 7860.0 1800.0 5990.0 4250.0

. 18000.0 7510.0 1760.0 5730.0 4590.0

. 17850.0 7730.0 1790.0 5870.0 4460.0

. 17930.0 7750.0 1810.0 5980.0 4270.0

. 18100.0 7820.0 1840.0 6330.0 4110.0

. 18170.0 7710.0 1700.0 6940.0 3720.0

. 18600.0 7770.0 1870.0 6280.0 2990.0

. 18730.0 7810.0 1900.0 6540.0 3480.0

. 19100.0 7800.0 1930.0 7010.0 3690.0

. 18840.0 7730.0 1900.0 7130.0 3730.0

. 18690.0 7700.0 1870.0 6970.0 3810.0

2. Расчет показателей вариации динамических рядов

После того, как мы ввели все исходные данные в программу, она посчитала нам показатели динамических рядов для всех признаков:

Таблица 3

Показатели по 1-му признаку :

Признак Абсолютные Темпы Темпы Цепные темпыразности роста прироста роста

.0 ------ 1.000 .000 -----

.0 170.0 1.011 .011 1.011

.0 340.0 1.033 .033 1.022

.0 190.0 1.045 .045 1.012

.0 600.0 1.084 .084 1.037

.0 50.0 1.087 .087 1.003

.0 320.0 1.108 .108 1.019

.0 230.0 1.123 .123 1.013

.0 350.0 1.145 .145 1.020

.0 150.0 1.155 .155 1.008

.0 100.0 1.161 .161 1.006

.0 -150.0 1.152 .152 .992

.0 80.0 1.157 .157 1.004

.0 170.0 1.168 .168 1.009

.0 70.0 1.172 .172 1.004

.0 430.0 1.200 .200 1.024

.0 130.0 1.208 .208 1.007

.0 370.0 1.232 .232 1.020

.0 -260.0 1.215 .215 .986

.0 -150.0 1.206 .206 .992

Таблица 4

Показатели по 2-му признаку :

Признак Абсолютные Темпы Темпы Цепные темпыразности роста прироста роста

.0 ------ 1.000 .000 -----

.0 50.0 1.007 .007 1.007

.0 80.0 1.018 .018 1.011

.0 50.0 1.025 .025 1.007

.0 130.0 1.044 .044 1.018

.0 40.0 1.049 .049 1.005

.0 70.0 1.059 .059 1.009

.0 280.0 1.099 .099 1.037

.0 20.0 1.101 .101 1.003

.0 40.0 1.107 .107 1.005

.0 -350.0 1.058 .058 .955

.0 220.0 1.089 .089 1.029

.0 20.0 1.092 .092 1.003

.0 70.0 1.101 .101 1.009

.0 -110.0 1.086 .086 .986

.0 60.0 1.094 .094 1.008

.0 40.0 1.100 .100 1.005

.0 -10.0 1.099 .099 .999

.0 -70.0 1.089 .089 .991

.0 -30.0 1.085 .085 .996

Таблица 5

Показатели по 3-му признаку :

Признак Абсолютные Темпы Темпы Цепные темпыразности роста прироста роста

.0 ------ 1.000 .000 -----

.0 30.0 1.021 .021 1.021

.0 40.0 1.048 .048 1.027

.0 60.0 1.090 .090 1.039

.0 30.0 1.110 .110 1.019

.0 20.0 1.124 .124 1.012

.0 40.0 1.152 .152 1.025

.0 150.0 1.255 .255 1.090

.0 -80.0 1.200 .200 .956

.0 60.0 1.241 .241 1.034

.0 -40.0 1.214 .214 .978

.0 30.0 1.234 .234 1.017

.0 20.0 1.248 .248 1.011

.0 30.0 1.269 .269 1.017

.0 -140.0 1.172 .172 .924

.0 170.0 1.290 .290 1.100

.0 30.0 1.310 .310 1.016

.0 30.0 1.331 .331 1.016

.0 -30.0 1.310 .310 .984

.0 -30.0 1.290 .290 .984

Таблица 6

Показатели по 4-му признаку :

Признак Абсолютные Темпы Темпы Цепные темпыразности роста прироста роста

.0 ------ 1.000 .000 -----

.0 260.0 1.050 .050 1.050

.0 160.0 1.080 .080 1.029

.0 40.0 1.088 .088 1.007

.0 -230.0 1.044 .044 .960

.0 140.0 1.070 .070 1.026

.0 -310.0 1.011 .011 .945

.0 440.0 1.095 .095 1.083

.0 60.0 1.107 .107 1.010

.0 180.0 1.141 .141 1.031

.0 -260.0 1.091 .091 .957

.0 140.0 1.118 .118 1.024

.0 110.0 1.139 .139 1.019

.0 350.0 1.206 .206 1.059

.0 610.0 1.322 .322 1.096

.0 -660.0 1.196 .196 .905

.0 260.0 1.246 .246 1.041

.0 470.0 1.335 .335 1.072

.0 120.0 1.358 .358 1.017

.0 -160.0 1.328 .328 .978

Таблица 7

Показатели по 5-му признаку:

Признак Абсолютные Темпы Темпы Цепные темпыразности роста прироста роста

.0 ------ 1.000 .000 -----

.0 -170.0 .954 -.046 .954

.0 160.0 .997 -.003 1.045

.0 40.0 1.008 .008 1.011

.0 570.0 1.162 .162 1.153

.0 -130.0 1.127 .127 .970

.0 500.0 1.262 .262 1.120

.0 -640.0 1.089 .089 .863

.0 350.0 1.184 .184 1.087

.0 -130.0 1.149 .149 .970

.0 340.0 1.241 .241 1.080

.0 -130.0 1.205 .205 .972

.0 -190.0 1.154 .154 .957

.0 -160.0 1.111 .111 .963

.0 -390.0 1.005 .005 .905

.0 -730.0 .808 -.192 .804

.0 490.0 .941 -.059 1.164

.0 210.0 .997 -.003 1.060

.0 40.0 1.008 .008 1.011

.0 80.0 1.030 .030 1.021

Как уже было упомянуто выше, исходная информация качественная, и поэтому на ее основе можно проводить анализ.

2.1 Исследование исходных динамических рядов на непрерывность

Статистический анализ выполняется для непрерывных динамических рядов. Непрерывность ряда является необходимым условием комплексного анализа динамических рядов. Поэтому до начала анализа необходимо исходные динамические ряды проверить на непрерывность. Для этого рассчитываются ряды цепных темпов роста в пределах каждого динамического ряда (в нашем случае это сделала компьютерная программа).

Ряд считается непрерывным, если значения цепных темпов роста (ti) удовлетворяют следующим условиям: (2.1.18) для количественных признаков и (2.1.19) для качественных признаков.

Так как у нас в исходных данных даны количественные признаки, то мы применяем формулу 2.1.18. Как видно из приведенных выше показателей значения цепных темпов роста для всех признаков удовлетворяют условию (2.1.18), следовательно, эти ряды непрерывны, поэтому можно проводить анализ.

2.2 Характеристика динамики признака-функции и признаков-факторов

Динамика может быть растущей или убывающей, а характер - спокойный, пульсивный, равномерный. Кроме того, выделяются зоны интенсивной динамики (растущей или убывающей).

Направленность динамики ряда определяется двояко: визуально и расчетным способом. Визуальное определение предполагает сопоставление крайних (последнего и начального) уровней ряда. Второй способ сопряжен с расчетом среднегодовых темпов роста () в пределах изучаемого периода. При растущей динамике >1, при убывающей <1.

Программа определила направленность динамических рядов:

Определение направленности динамических рядов :

По крайним уровням ряда :

Направленность 1-го признака растущая.

Направленность 2-го признака растущая.

Направленность 3-го признака растущая.

Направленность 4-го признака растущая.

Направленность 5-го признака растущая.

По цепным темпам роста :

Средний цепной темп роста по 1-му признаку равен 1.0099

Динамика растущая.

Средний цепной темп роста по 2-му признаку равен 1.0043

Динамика растущая.

Средний цепной темп роста по 3-му признаку равен 1.0135

Динамика растущая.

Средний цепной темп роста по 4-му признаку равен 1.0150

Динамика растущая.

Средний цепной темп роста по 5-му признаку равен 1.0015

Динамика растущая.

Для выявления характера динамики составляется таблица абсолютных разностей, каждый уровень которой равен разности двух соседних уровней исходных рядов признака-фукнции и признаков-факторов. В пределах каждого из столбцов этой таблицы следует выделить точки «перегиба» признака. Последние регистрируют возрастание соседних абсолютных разностей более, чем в 2 раза, или изменение знака абсолютных разностей на обратный.

Программа посчитала абсолютные разности (таблица 8):

Таблица 8

Таблица абсолютных разностей с указанием точек перегиба.

(единица под числом - перегиб, ноль - его отсутствие.)

--N------Y----------X1---------X2---------X3---------X4---

. 170.0 50.0 30.0 260.0 -170.0

1 0 1 1

. 340.0 80.0 40.0 160.0 160.0

1 1 1 1

. 190.0 50.0 60.0 40.0 40.0

1 1 1 1

. 600.0 130.0 30.0 -230.0 570.0

1 1 1 1

. 50.0 40.0 20.0 140.0 -130.0

1 1 1 1

. 320.0 70.0 40.0 -310.0 500.0

1 1 1 1

. 230.0 280.0 150.0 440.0 -640.0

1 1 1 1

. 350.0 20.0 -80.0 60.0 350.0

1 1 1 1

. 150.0 40.0 60.0 180.0 -130.0

1 1 1 1

. 100.0 -350.0 -40.0 -260.0 340.0

1 1 1 1

. -150.0 220.0 30.0 140.0 -130.0

1 1 0 0

. 80.0 20.0 20.0 110.0 -190.0

1 1 1 0

. 170.0 70.0 30.0 350.0 -160.0

1 1 1 1

. 70.0 -110.0 -140.0 610.0 -390.0

1 1 1 1

. 430.0 60.0 170.0 -660.0 -730.0

1 1 1 1

. 130.0 40.0 30.0 260.0 490.0

1 0 1 1

. 370.0 -10.0 30.0 470.0 210.0

1 1 1 1

. -260.0 -70.0 -30.0 120.0 40.0

1 0 1 1

. -150.0 -30.0 -30.0 -160.0 80.0

По таблице абсолютных разностей необходимо рассчитать число точек «перегиба» по столбцам и их долю в объеме каждого исходного ряда (20 уровней). Кроме того, необходимо указать количество совпадений точек «перегиба» для каждого из признаков-факторов с признаком-функцией, определить долю этих совпадений в общем числе точек «перегиба» у признака-функции. Если доля точек «перегиба» превышает 50% объема ряда, то это указывает на пульсивный характер динамики. В остальных случаях имеет место спокойная или равномерная (реже) динамика. Последняя характеризуется относительно устойчивыми значениями абсолютных разностей. Спокойной динамике соответствуют следующие значения среднегодовых темпов прироста (): 1-3% для количественных признаков и 0,5-1,5% для качественных.

Количество перегибов и их доля :

В 1-м столбце число перегибов равно : 17

Доля перегибов в этом столбце равна : 85.0%

Динамика пульсивна.

В 2-м столбце число перегибов равно : 18

Доля перегибов в этом столбце равна : 90.0%

Динамика пульсивна.

В 3-м столбце число перегибов равно : 15

Доля перегибов в этом столбце равна : 75.0%

Динамика пульсивна.

В 4-м столбце число перегибов равно : 17

Доля перегибов в этом столбце равна : 85.0%

Динамика пульсивна.

В 5-м столбце число перегибов равно : 16

Доля перегибов в этом столбце равна : 80.0%

Динамика пульсивна.

Количество совпадений и их доля :

Количество совпадений в 1-м и 2-м столбцах равно 17

Доля совпадений в этих столбцах равна : 100.0%

Количество совпадений в 1-м и 3-м столбцах равно 14

Доля совпадений в этих столбцах равна : 82.4%

Количество совпадений в 1-м и 4-м столбцах равно 16

Доля совпадений в этих столбцах равна : 94.1%

Количество совпадений в 1-м и 5-м столбцах равно 15

Доля совпадений в этих столбцах равна : 88.2%

При пульсивной динамике важно установить жесткость динамики признака-функции и каждого из признаков-факторов. Только при наличии жесткой связи можно говорить о надежности информационного поля. Важно отметить, что все признаки-факторы имеют жесткую связь с признаком-функцией, т.к. процент совпадения точек перегиба признаков-факторов и признака-функции велик.

Программа определила жесткость динамической связи для всех признаков:

Оценка жесткости динамической связи :

-й признак-фактор имеет жесткую динамическую

связь с признаком-функцией.

-й признак-фактор имеет жесткую динамическую

связь с признаком-функцией.

-й признак-фактор имеет жесткую динамическую

связь с признаком-функцией.

-й признак-фактор имеет жесткую динамическую

связь с признаком-функцией.

В пределах нашего поля важно выявить еще один момент: сонаправленность рядов признаков-факторов с признаком-функцией. Это условие переводит информационное поле в поле регрессии.

Мы видим, что динамика признака-функции и динамики признаков-факторов растущие, это свидетельствует о сонаправленности признака-функции с признаками факторами.

Кроме того, программа посчитала нам средние цепные темпы роста по всем признакам:

По цепным темпам роста :

Средний цепной темп роста по 1-му признаку равен 1.0099

Динамика растущая.

Средний цепной темп роста по 2-му признаку равен 1.0043

Динамика растущая.

Средний цепной темп роста по 3-му признаку равен 1.0135

Динамика растущая.

Средний цепной темп роста по 4-му признаку равен 1.0150

Динамика растущая.

Средний цепной темп роста по 5-му признаку равен 1.0015

Динамика растущая.

Все их значения превышают единицу, что также говорит нам о сонаправленности признака-функции с признаками-факторами.

Можем сделать вывод о том, что наше поле является полем регрессии.

2.3 Представительность признаков

Динамические ряды очерчивают нам поле регрессии, следовательно, статистические данные подвержены анализу. Этапы анализа, предшествующие этому моменту, ограничивались сопоставлением каждого признака в отдельности. Остальные этапы анализа выполняются в границах поля регрессии, т.е. для тех динамических рядов, которые это поле образуют.

Системный анализ включает в себя:

· Ранжирование признаков-факторов по представительности (по объему признака);

· Расчет оценочного показателя вариации и ранжирование признаков-факторов по нему;

· Проведение анализа парной корреляции;

· Построение уравнения множественной регрессии.

В зависимости от характера связи между подлежащим и сказуемым таблицы исходной информации по-разному определяется представительность (значимость) признаков-факторов по их влиянию на динамику признака-функции. При балансовой связи признаки-факторы, сонаправленные с признаком-функцией, ранжируются по их представительности, исходя из удельного веса их средней функции.

Рассчитаем соответствующие относительные величины.

Удельный вес признака Х1 в Y составляет 43,26%;

Х2 в Y составляет 9,87%;

Х3 в Y составляет 34,41%;

X4 в Y составляет 22,58%.

Таким образом, если произвести ранжирование признаков по представительности, получим:

Х1 - 43,26%;

Х3 - 34,41%;

Х4 -22,58%;

Х2 - 9,87%.

3. Расчет показателей вариации динамических рядов

Вторым критерием отбора признаков для построения уравнения множественной регрессии является вариация. Поэтому необходимо проверить признаки на вариабельность.

3.1 Теоретическая справка о показателях вариации

Вариация - отклонение индивидуальных значений признака в вариационном ряду от принятой базы - линии тренда, плановый уровень (нормативный), средние.

В экономической статистике за базу оценки вариации принимается средняя - модуль средней или устойчивая средняя.

Изучение вариации признаков в экономической статистике подчинено двум основным целям:

· оценка вариабельности (устойчивости) признака;

· оценка однородности совокупности по изучаемому признаку.

Вариацией называется наличие различий в индивидуальных значениях признака у единиц совокупности.

Показатели вариации оценивают изменение признака в ряду распределения. Базой для расчета этих показателей выступает статистическая средняя (обобщающая (типическая) характеристика явления по одному количественному признаку), рассчитывающаяся как среднее арифметическое.

В экономической статистике применяются следующие показатели вариации:

.среднее линейное отклонение - показатель измерения вариации в достаточно однородных совокупностях, поэтому его использование весьма ограничено.

Если под знаком суммы будет стоять не абсолютная величина разности между индивидуальным значением признака и средней, а ее квадрат, то будет иметь место другой показатель, который называется средний квадрат отклонения или дисперсия

.средний квадрат отклонения (дисперсия) - показатель, нивелирующий незначительные колебания в значениях признака, тем самым, исключая анализ сторонних влияний на признак, поэтому часто используется для оценки вариации.

Если извлечь корень из дисперсии, то получим среднее квадратическое отклонение.

.Среднее квадратичное отклонение регистрирует интервал колебания признака.

где xi - значение признака i-той группы; - среднее значение признака в исследуемой совокупности; n - число единиц совокупности; fi - число единиц i-той группы (частота или частость).

4.Коэффициент вариации от среднего линейного отклонения - относительная величина, использующаяся для оценки вариации и обеспечивающая высокую эффективность анализа.

.Коэффициент вариации от среднего квадратичного отклонения

Каждый из приведенных выше показателей имеет свою специфику использования.

Среднее линейное отклонение редко используется в статистике для анализа, так как этот показатель ограничен в своем применении, может использоваться только в однородных совокупностях (отклонение от смежного уровня не более 15-20%).

Дисперсия очень широко применяется при анализе вариации. Этот показатель не учитывает мелкие колебания признака, то есть учитывает влияние лишь постоянных факторов. Дисперсия служит также для оценки устойчивости изучаемой совокупности.

Среднее квадратическое отклонение является наиболее часто применяемым показателем для оценки вариации, так как оно регистрирует интервал колебания признака.

Из всех приведенных показателей самыми надежными являются коэффициенты вариации, так как они являются относительными величинами, то есть отражают качество изучаемых процессов.

3.2 Расчет показателей вариации динамических рядов

Для каждого признака программа посчитала показатели вариации.

Показатели вариации для 1-го признака :

Минимальное значение .155000E+05

Максимальное значение .191000E+05

Размах вариации .360000E+04

Среднее по признаку .175630E+05

Среднее линейное отклонение .890400E+03

Дисперсия .111472E+07

Ср-квадратическое отклонение .105580E+04

Козффициент вариации .506975E+01

Лин.коэффициент вариации .601152E+01

Коэффициент осцилляции .204976E+02

Показатели вариации для 2-го признака :

Минимальное значение .710000E+04

Максимальное значение .786000E+04

Размах вариации .760000E+03

Среднее по признаку .759750E+04

Среднее линейное отклонение .213000E+03

Дисперсия .580288E+05

Ср-квадратическое отклонение .240892E+03

Козффициент вариации .280355E+01

Лин.коэффициент вариации .317067E+01

Коэффициент осцилляции .100033E+02

Показатели вариации для 3-го признака :

Минимальное значение .145000E+04

Максимальное значение .193000E+04

Размах вариации .480000E+03

Среднее по признаку .173350E+04

Среднее линейное отклонение .122800E+03

Дисперсия .204628E+05

Ср-квадратическое отклонение .143048E+03

Козффициент вариации .708393E+01

Лин.коэффициент вариации .825198E+01

Коэффициент осцилляции .276896E+02

Показатели вариации для 4-го признака :

Минимальное значение .525000E+04

Максимальное значение .713000E+04

Размах вариации .188000E+04

Среднее по признаку .604400E+04

Среднее линейное отклонение .489200E+03

Дисперсия .331854E+06

Ср-квадратическое отклонение .576068E+03

Козффициент вариации .809398E+01

Лин.коэффициент вариации .953123E+01

Коэффициент осцилляции .311052E+02

Показатели вариации для 5-го признака :

Минимальное значение .299000E+04

Максимальное значение .467000E+04

Размах вариации .168000E+04

Среднее по признаку .396500E+04

Среднее линейное отклонение .358000E+03

Дисперсия .172485E+06

Ср-квадратическое отклонение .415313E+03

Козффициент вариации .902900E+01

Лин.коэффициент вариации .104745E+02

Коэффициент осцилляции .423707E+02

Для системного анализа в рамках поля регрессии критериальными показателями регрессии принимается (для количественных признаков) линейный коэффициент вариации.

Как видно из вышеперечисленных показателей вариации, которые рассчитала для нас программа, наиболее устойчивым является признак Х1. Значение линейного коэффициента вариации равно 6,01%. Самым вариабельным является Х4, значение коэффициента линейной вариации которого равно 10,47%. Таким образом, если выполнить ранжирование признаков по вариабельности от самого устойчивого к самому вариабельному (неустойчивому), то получим:

Х1-6,01 %

Х2-8,25 %

Х3-9,53 %

Х4-10,47 %

4. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции

Этот анализ выполняется для всех видов связи (кроме полной балансовой связи) между признаком-функцией и признаками-факторами. Данный анализ и является третьим критерием отбора признаков для построения уравнения множественной регрессии.

Количественное измерение тесноты связи осуществляется последовательно для каждого из признаков-факторов по мере уменьшения их значимости (представительности).

4.1 Теоретическая справка о парной корреляции

Статистика разработала множество методов изучения связей, выбор которых зависит от целей исследования и от поставленных задач. Связи между признаками и явлениями ввиду их большого разнообразия классифицируют по ряду оснований.

По характеру зависимости признаков различают:

· Функциональную (полную) связь;

· Корреляционную (неполную) связь.

Корреляционная связь - важнейший частный случай статистической связи, состоящий в том, что это связь, при которой определенному значению факторного признака <#"822524.files/image032.gif">. Кроме того, при линейной корреляционной форме уравнения применяется другой показатель тесноты связи - коэффициент корреляции :

(4.1.25)

Обычно считают связь сильной, если r0,7; средней тесноты, при 0,5r0,7; слабой, при r < 0.5.

Коэффициент парной корреляции характеризует наличие линейной связи между двумя переменными.

Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру расположения точек поля можно составить предварительное мнение о форме зависимости случайных величин (например, о том, что одна величина в среднем возрастает или убывает при возрастании другой). Для численной обработки результаты обычно группируют и представляют в форме корреляционной таблицы.

Коэффициент корреляции и корреляционное отношение дают более точную информацию о характере и силе связи, чем картина корреляционного поля.

4.2 Исследование коэффициентов парной корреляции

Итак, коэффициент корреляции - наиболее существенный критерий надежности регрессионного поля. Программа выполнила расчет коэффициентов парной корреляции для всех признаков:

Расчет коэффициентов парной корреляции :

Промежуточные цифры для 1-й пары признаков :

Среднее по признаку-функции : .175630E+05

Среднее по признаку-фактору : .759750E+04

Среднее по их произведению : .133661E+09

Отклонение признака-функции : .105580E+04

Отклонение признака-фактора : .240892E+03

Коэффициент парной корреляции : .888420E+00

Промежуточные цифры для 2-й пары признаков :

Среднее по признаку-функции : .175630E+05

Среднее по признаку-фактору : .173350E+04

Среднее по их произведению : .305907E+08

Отклонение признака-функции : .105580E+04

Отклонение признака-фактора : .143048E+03

Коэффициент парной корреляции : .961749E+00

Промежуточные цифры для 3-й пары признаков :

Среднее по признаку-функции : .175630E+05

Среднее по признаку-фактору : .604400E+04

Среднее по их произведению : .106647E+09

Отклонение признака-функции : .105580E+04

Отклонение признака-фактора : .576068E+03

Коэффициент парной корреляции : .815298E+00

Промежуточные цифры для 4-й пары признаков :

Среднее по признаку-функции : .175630E+05

Среднее по признаку-фактору : .396500E+04

Среднее по их произведению : .696165E+08

Отклонение признака-функции : .105580E+04

Отклонение признака-фактора : .415313E+03

Коэффициент парной корреляции : -.474881E-01

Полученные коэффициенты парной корреляции :

.888420E+00

.961749E+00

.815298E+00

.474881E-01

Таким образом мы видим, что наиболее надежной является связь признака-функции Y с признаком-фактором Х2. Знак перед коэффициентом корреляции говорит о прямой или обратной связи между признаком-функцией и признаком-фактором. Соответственно, если знак «+» связь прямая, если «-» - обратная, что находит свое отражение при последующем отборе признаков для построения уравнения множественной регрессии (т.к. нельзя брать признаки, имеющие коэффициенты с разными знаками).

Анализируя данную таблицу, можем сказать, что имеет место не только прямая, но и обратная связь, так как один из коэффициентов имеет отрицательный знак. Отметим, что признак-фактор X4, имеющий отрицательное значение, не используется при составлении уравнения множественной регрессии.

Произведем ранжирование по коэффициенту парной корреляции:

Х2 (коэффициент парной корреляции = 0,96)

Х1 (коэффициент парной корреляции = 0,88)

Х3 (коэффициент парной корреляции = 0,81)

Х4 (коэффициент парной корреляции = -0,05)

5. Построение уравнение многофакторной корреляционной связи

.1 Теоретическая справка о множественной регрессии

Общее назначение множественной регрессии состоит в анализе связи между несколькими независимыми переменными (называемыми также регрессорами или предикторами) и зависимой переменной. В общественных и естественных науках процедуры множественной регрессии чрезвычайно широко используются в исследованиях.

Статическая модель, представленная уравнением регрессии с несколькими переменными величинами, называется многофакторной моделью или множественной регрессией.

Двумя наиболее важными этапами построения многофакторных моделей являются:

· выбор формы связи (уравнения регрессии);

· отбор факторных признаков.

Наиболее приемлемым способом выбора формы связи, то есть вида исходного уравнения, является метод перебора различных уравнений.

Для оценки тесноты множественных корреляционных связей применяются линейный коэффициент множественной корреляции и теоретическое множественное корреляционное отношение.

Уравнение прямой линии записывается следующим образом: , где а - это константа(по-другому свободный член), b - это угловой коэффициент(по-другому регрессионный коэффициент или B-коэффициент). Таким образом, чтобы найти (предсказать) переменную <#"822524.files/image036.gif"> (5.1.26)

Это уравнение должно описывать связь между признаком-функцией и двумя наиболее результативными из числа признаков-факторов. Для построения уравнения важно определить характер связи (линейная или нелинейная) между признаком-функцией и выделенными признаками-факторами. Это устанавливается при сопоставлении коэффициента парной корреляции и корреляционного отношения для исходных и выпрямленных рядов указанных признаков-факторов. Полная балансовая связь имеет линейный характер.

Если значения указанных коэффициентов имеют одинаковый знак и корректны, то это подтверждает линейный характер связи.

.2 Построение уравнения множественной регрессии

Итак, после проделанного анализа выбираем два наиболее подходящих признака. Признаки, по которым должно быть построено уравнение выбираются на основе рассчитанных линейных коэффициентов вариации - по минимальному значению, либо по максимальным значениям коэффициентов парной корреляции. А также по долевому представительству в средней функции.

Ими являются признак Х1, который подходит по всем показателям: он обладает наибольшей представительностью, у него максимальный коэффициент вариации и большой коэффициент парной корреляции (после признака Х2); и признак Х3: так его коэффициент парной корреляции практически такой же, как у признака Х2 . Мы не учитываем признак Х4, так как он имеет отрицательный знак при коэффициенте парной корреляции, а, следовательно, он выпадает. Признак Х2 так же может быть использован, но не желателен для построения уравнения множественной регрессии, так как, несмотря на самый большой коэффициент парной корреляции, он обладает наименьшей представительностью

Для построения уравнения множественной регрессии необходимо найти коэффициенты регрессии. Нам необходимо построить модель уравнения множественной регрессии по выбранным нами признакам: Х1 и Х3. С помощью программы определим коэффициенты регрессии (b) для уравнения, которое характеризует, в какой мере увеличивается функция Y с ростом на единицу величины X.

Программа посчитала для этих признаков коэффициенты регрессии:

Для пары признаков Х1 и Х3 получили следующие коэффициенты регрессии:

Коэффициенты регрессии :

---------------------------

| Kn | Значение |

--------------------------

| b1 | -.792277E+04 |

--------------------------

| b2 | .272678E+01 |

--------------------------

| b3 | .789059E+00 |

--------------------------

Расчет абсолютной ошибки :

Итерация равна : 64

Абсолютная ошибка равна : .923357E+03

Относительная ошибка равна : 5.13%

Расчет произведен по 11-му уровню.

Ошибка не превышает регламента.

Имитация явления данным уравнением надежна.

Подставим найденные коэффициенты в уравнение вида:

(5.2.27)

(5.2.28)

Произведем расчет относительной ошибки по пятому контрольному уровню:

Определенная по пятому контрольному уровню ошибка, которая равна 0,65%, не превышает регламента, что говорит о надежности поля регрессии и о справедливости учета нами линейной связи.

Поэтому, можно сделать вывод о том, что уравнение, составленное по признакам Х1 и Х3 полностью удовлетворяет всем поставленным условиям.

Данное уравнение имеет вид:

Заключение

Таким образом, в данной курсовой работе был проведен качественный и количественный анализ таблицы исходных динамических рядов, выполнено ранжирование признаков-факторов по их долевому представительству в средней функции и коэффициентам вариации, произведено количественное измерение тесноты связи между динамикой признака-функции и определенного числа признаков-факторов методом парной корреляции, а так же было построено уравнение множественной регрессии.

Полученное уравнение является корректным и надёжно имитирует динамику признака - функции, так как относительная ошибка не превышает допустимый регламент.

Список литературы

) Скобелина В.П., Лебедева Е.П., Якшин А.В.// Статистика. Метод. указания к курсовой работе.// - СПб.:СПбГГИ, 1999.

2) Елисеева И.И., Юзбашев М.М. //Общая теория статистики. // - Москва: Финансы и статистика, 2001.

Анализ динамических рядов и построение уравнения множественной регрессии

Анализ динамических рядов и построение уравнения множественной регрессии

Санкт-Петербург

По дисциплине: Статистика

1. Качественный анализ таблицы исходных динамических рядов

.1 Исходные данные

1.2 Анализ исходных динамических рядов признака-функции и признака-фактора

1.3 Теоретические сведения о динамических рядах и их показателях

1.4 Анализ характера связи между изучаемым обобщающим признаком и признаками-факторами

2. Расчет показателей вариации динамических рядов

2.1 Исследование исходных динамических рядов на непрерывность

2.2 Характеристика динамики признака-функции и признаков-факторов

2.3 Представительность признаков

3. Расчет показателей вариации динамических рядов

3.1 Теоретическая справка о показателях вариации

3.2 Расчет показателей вариации динамических рядов

4. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции

4.1 Теоретическая справка о парной корреляции

4.2 Исследование коэффициентов парной корреляции

5. Построение уравнение многофакторной корреляционной связи

.1 Теоретическая справка о множественной регрессии

.2 Построение уравнения множественной регрессии

Заключение

Список литературы

Похожие работы на - Анализ динамических рядов и построение уравнения множественной регрессии