Применение методов дисперсионного анализа в экономике

Вид работы:

Курсовая работа (т)
Предмет:

Менеджмент
Язык:

Русский
,
Формат файла:
MS Word

633,6 Кб
Опубликовано:

2013-01-16

Скачать курсовую работу Читать текст online Заказать курсовую
*Помощь в написании! Посмотреть все курсовые работы

Вы можете узнать стоимость помощи в написании студенческой работы.

Применение методов дисперсионного анализа в экономике

Введение

В своей работе я поставила цель: узнать, как применяются методы дисперсионного анализа в экономике. Для достижения этой цели мне предстоит выполнить ряд задач:

1. Узнать, что такое дисперсионный анализ;

2. Узнать, какие бывают методы дисперсионного анализа;

. Выяснить, как производится дисперсионный анализ;

. Выяснить, как применяются методы дисперсионного анализа в экономике.

1. Теоретическая часть

.1 Основные понятия

Анализ отклонений (дисперсионный анализ) - анализ и исследования причин отклонений фактических затрат от нормативных. Отклонение считается благоприятным, если величина фактических затрат меньше величины нормативных затрат; оно неблагоприятно, если фактические затраты превышают величину нормативных затрат. Неблагоприятные отклонения нуждаются в дальнейшем исследовании причин своего возникновения.

Дисперсионный анализ - раздел математической статистики, посвященный методам выявления влияния отдельных факторов на результат эксперимента (физического, производственного, экономического эксперимента).

При этом исходят из положения о том, что существенность фактора в определенных условиях характеризуется его вкладом в дисперсию результата. Английский статистик Р. Фишер, разработавший этот метод, определил его как “отделение дисперсии, приписываемой одной группе причин, от дисперсии, приписываемой другим группам”.

Анализ производится следующим образом:

. Группируют совокупность наблюдений по факторному признаку

. Находят среднее значение результата и дисперсию по каждой группе.

. Определяют общую дисперсию и вычисляют, какая доля ее зависит от условий, общих для всех групп, какая - от исследуемого фактора, а какая - от случайных причин.

. С помощью специального критерия определяют, насколько существенны различия между группами наблюдений и, следовательно, можно ли считать ощутимым влияние тех или иных факторов.

Дисперсионный анализ применяется в планировании эксперимента и в ряде областей экономических исследований, где он служит, в частности, предварительным этапом к регрессионному анализу статистических данных, поскольку позволяет выделить относительно небольшое (но достаточное для целей исследования) количество параметров регрессии.

В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.

В зависимости от количества факторов, определяющих вариацию результативного признака, дисперсионный анализ подразделяют на однофакторный и многофакторный.

Основными схемами организации исходных данных с двумя и более факторами являются:

· перекрестная классификация, характерная для моделей I, в которых каждый уровень одного фактора сочетается при планировании эксперимента с каждой градацией другого фактора;

· иерархическая (гнездовая) классификация, характерная для модели II, в которой каждому случайному, наудачу выбранному значению одного фактора соответствует свое подмножество значений второго фактора.

Если одновременно исследуется зависимость отклика от качественных и количественных факторов, т.е. факторов смешанной природы, то используется ковариационный анализ.

При обработке данных эксперимента наиболее разработанными и поэтому распространенными считаются две модели. Их различие обусловлено спецификой планирования самого эксперимента. В модели дисперсионного анализа с фиксированными эффектами исследователь намеренно устанавливает строго определенные уровни изучаемого фактора. Термин «фиксированный эффект» в данном контексте имеет тот смысл, что самим исследователем фиксируется количество уровней фактора и различия между ними. При повторении эксперимента он или другой исследователь выберет те же самые уровни фактора. В модели со случайными эффектами уровни значения фактора выбираются исследователем случайно из широкого диапазона значений фактора, и при повторных экспериментах, естественно, этот диапазон будет другим.

Таким образом, данные модели отличаются между собой способом выбора уровней фактора, что, очевидно, в первую очередь влияет на возможность обобщения полученных экспериментальных результатов. Для дисперсионного анализа однофакторных экспериментов различие этих двух моделей не столь существенно, однако в многофакторном дисперсионном анализе оно может оказаться весьма важным.

При проведении дисперсионного анализа должны выполняться следующие статистические допущения: независимо от уровня фактора величины отклика имеют нормальный (Гауссовский) закон распределения и одинаковую дисперсию. Такое равенство дисперсий называется гомогенностью. Таким образом, изменение способа обработки сказывается лишь на положении случайной величины отклика, которое характеризуется средним значением или медианой. Поэтому все наблюдения отклика принадлежат сдвиговому семейству нормальных распределений.

Говорят, что техника дисперсионного анализа является "робастной". Этот термин, используемый статистиками, означает, что данные допущения могут быть в некоторой степени нарушены, но, несмотря на это, технику можно использовать.

При неизвестном законе распределения величин отклика используют непараметрические (чаще всего ранговые) методы анализа.

В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Вариацию, обусловленную влиянием фактора, положенного в основу группировки, характеризует межгрупповая дисперсия σ2. Она является мерой вариации частных средних по группам вокруг общей средней и определяется по формуле:

где k - число групп;- число единиц в j-ой группе;

- частная средняя по j-ой группе;

- общая средняя по совокупности единиц.

Вариацию, обусловленную влиянием прочих факторов, характеризует в каждой группе внутригрупповая дисперсия σj2.

Между общей дисперсией σ02, внутригрупповой дисперсией σ2 и межгрупповой дисперсией существует соотношение:

σ02 = + σ2.

Внутригрупповая дисперсия объясняет влияние неучтенных при группировке факторов, а межгрупповая дисперсия объясняет влияние факторов группировки на среднее значение по группе.

1.2 Однофакторный дисперсионный анализ

Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак.

Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении более двух независимых выборок, полученных из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.

Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).

Пусть - i - элемент () - выборки (), где m - число выборок, nk - число данных в - выборке. Тогда - выборочное среднее -выборки определяется по формуле

Общее среднее вычисляется по формуле

, где

Основное тождество дисперсионного анализа имеет следующий вид:

Где Q1 - сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами);- сумма квадратов отклонений наблюдаемых значений от выборочной средней (сумма квадратов отклонений внутри групп); Q - общая сумма квадратов отклонений наблюдаемых значений от общего среднего .

Расчет этих сумм квадратов отклонений осуществляется по следующим формулам:

В качестве критерия необходимо воспользоваться критерием Фишера:

Если расчетное значение критерия Фишера будет меньше, чем табличное значение - нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений, в противном случае, независимый фактор оказывает существенное влияние на разброс средних значений (λ- уровень значимости, уровень риска, обычно для экономических задач λ=0,05).

Недостаток однофакторного анализа: невозможно выделить те выборки, которые отличаются от других. Для этой цели необходимо использовать метод Шеффе или проводить парные сравнения выборок.

Таблица 1: Базовая таблица однофакторного дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средний квадрат	Математическое ожидание среднего квадрата
Межгрупповая		m-1	= Q1/(m-1)

Внутригрупповая mn-m = Q2/(mn-m)

M(S)= σ2

Общая

mn-1

Одной из используемых моделей данных в дисперсионном анализе является двухфакторная модель. Она состоит в учёте систематических (первый фактор) и случайных (второй фактор) ошибок в определении измеряемых параметров.

Пусть с помощью методов производится измерение нескольких параметров, чьи точные значения - . В таком случае, результаты измерений различных величин различными методами можно представить как:

где:

- результат измерения -го параметра по методу ;

- точное значение -го параметра;

- систематическая ошибка измерения -го параметра по методу ;

- случайная ошибка измерения -го параметра по методу .

Тогда дисперсии случайных величин , , , , где:

выражаются как:

и удовлетворяют тождеству:

Двухфакторная схема позволяет лишь обнаружить систематические расхождения, но непригодна для их численной оценки с последующим исключением из результатов наблюдений. Эта цель может быть достигнута только при многократных измерениях (то есть при повторных использованиях указанной схемы над данными повторных экспериментов).

1.4 Многофакторный дисперсионный анализ

Следует сразу же отметить, что принципиальной разницы между многофакторным и однофакторным дисперсионным анализом нет. Многофакторный анализ не меняет общую логику дисперсионного анализа, а лишь несколько усложняет ее, поскольку, кроме учета влияния на зависимую переменную каждого из факторов по отдельности, следует оценивать и их совместное действие. Таким образом, то новое, что вносит в анализ данных многофакторный дисперсионный анализ, касается в основном возможности оценить межфакторное взаимодействие. Тем не менее, по-прежнему остается возможность оценивать влияние каждого фактора в отдельности. В этом смысле процедура многофакторного дисперсионного анализа (в варианте ее компьютерного использования) более экономична, поскольку всего за один запуск решает сразу две задачи: оценивается влияние каждого из факторов и их взаимодействие.

Данные, подвергаемые многофакторному дисперсионному анализу, часто обозначают в соответствии с количеством факторов и их уровней.

Предположив, что в рассматриваемой задаче о качестве различных m партий изделия изготавливались на разных t станках и требуется выяснить, имеются ли существенные различия в качестве изделий по каждому фактору:

А - партия изделий;

B - станок.

В результате получается переход к задаче двухфакторного дисперсионного анализа.

В таблице 2 представлен общий вид вычисления значений, с помощью дисперсионного анализа.

Таблица 2: Базовая таблица многофакторного дисперсионного анализа

Компоненты дисперсии	Сумма квадратов	Число степеней свободы	Средние квадраты
Межгрупповая (фактор А)	m-1
Межгрупповая (фактор B)	l-1
Взаимодействие	(m-1)(l-1)
Остаточная	mln - ml
Общая	mln - 1

дисперсионный анализ нормативный отклонение

Проверка нулевых гипотез H_A, H_B, H_AB об отсутствии влияния на рассматриваемую переменную факторов А, B и их взаимодействия AB осуществляется сравнением отношений , , (для модели I с фиксированными уровнями факторов) или отношений , , (для случайной модели II) с соответствующими табличными значениями F - критерия Фишера - Снедекора. Для смешанной модели III проверка гипотез относительно факторов с фиксированными уровнями производится также как и в модели II, а факторов со случайными уровнями - как в модели I.

Если n=1, т.е. при одном наблюдении в ячейке, то не все нулевые гипотезы могут быть проверены так как выпадает компонента Q3 из общей суммы квадратов отклонений, а с ней и средний квадрат , так как в этом случае не может быть речи о взаимодействии факторов.

С точки зрения техники вычислений для нахождения сумм квадратов Q1, Q2, Q3, Q4, Q целесообразнее использовать формулы:

Q₃= Q - Q₁ - Q₂ - Q₄.

отклонение от основных предпосылок дисперсионного анализа - нормальности распределения исследуемой переменной и равенства дисперсий в ячейках (если оно не чрезмерное) - не сказывается существенно на результатах дисперсионного анализа при равном числе наблюдений в ячейках, но может быть очень чувствительно при неравном их числе. Кроме того, при неравном числе наблюдений в ячейках резко возрастает сложность аппарата дисперсионного анализа. Поэтому рекомендуется планировать схему с равным числом наблюдений в ячейках, а если встречаются недостающие данные, то возмещать их средними значениями других наблюдений в ячейках. При этом, однако, искусственно введенные недостающие данные не следует учитывать при подсчете числа степеней свободы.

2. Практическая часть

.1 Решение задач двухфакторного дисперсионного анализ без повторений

Microsoft Excel располагает функцией: Двухфакторный дисперсионный анализ без повторений, которая используется для выявления факта влияния контролируемых факторов А и В на результативный признак на основе выборочных данных, причем каждому уровню факторов А и В соответствует только одна выборка. Для вызова этой функции необходимо на панели меню выбрать команду Сервис - Анализ данных. На экране раскроется окно Анализ данных, в котором следует выбрать значение Двухфакторный дисперсионный анализ без повторений и щелкнуть на кнопке ОК. В результате на экране раскроется диалоговое окно, показанное на рисунке 1.

Рис. 1: диалоговое окно функции

В диалоговом окне задаются следующие параметры.

. В поле Входной материал вводится ссылка на диапазон ячеек, содержащий анализируемые данные.

. Флажок опции Метки устанавливается в том случае, если первая строка во входном диапазоне содержит заголовки столбцов. Если заголовки отсутствуют, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

. В поле Альфа вводится принятый уровень значимости α, соответствующий вероятности возникновения ошибки первого рода.

. Переключатель в группе Параметры вывода может быть установлен в одно из трех положений: Выходной интервал, Новый рабочий лист или Новая рабочая книга.

Пример

Рассмотрим использование функции Двухфакторный дисперсионный анализ без повторений на следующем примере.

На рисунке. 2 представлены данные об урожайности (ц/га) четырех сортов пшеницы (четыре уровня фактора А), достигнутой при использовании пяти типов удобрений (пять уровней фактора В). Данные получены на 20 участках одинакового размера и аналогичного почвенного покрова. Необходимо определить, влияет ли сорт и тип удобрения на урожайность пшеницы.

Рис. 2: данные об урожайности

Результаты двухфакторного дисперсионного анализа с помощью функции Двухфакторный дисперсионный анализ без повторений представлены на рисунке 3.

Как видно по результатам, расчетное значение величины F-статистики для фактора А (тип удобрения) F^А=l,67, а критическая область образуется правосторонним интервалом (3,49; +∞). Так как F^А=l,67 не попадает в критическую область, гипотезу Н_А: a₁ = a₂ + … = a_k принимаем, т.е. считаем, что в этом эксперименте тип удобрения не оказал влияния на урожайность.

Рис. 3: Результаты двухфакторного дисперсионного анализа

Расчетное значение величины F-статистики для фактора В (сорт пшеницы) F^В =2,03, а критическая область образуется правосторонним интервалом (3,259;+∞).

также принимаем, т.е. считаем, что в данном эксперименте сорт пшеницы также не оказал влияния на урожайность.

2.2 Решение задач двухфакторного дисперсионного анализа c повторениями

Microsoft Excel располагает функцией: Двухфакторный дисперсионный анализ с повторениями, которая также используется для выявления факта влияния контролируемых факторов А и В на результативный признак на основе выборочных данных, однако каждому уровню одного из факторов А (или В) соответствует более одной выборки данных.

Рассмотрим использование функции Двухфакторный дисперсионный анализ с повторениями на следующем примере.

Пример

В таблице. 3 приведены суточные привесы (г) собранных для исследования 18 поросят в зависимости от метода удержания поросят (фактор А) и качества их кормления (фактор В).

Таблица 3: суточные привесы собранных для исследования 18 поросят

Количество голов в группе (фактор А)	Содержание протеина в корме, г (фактор В)
	В1=80	В2=100
А1-30	530, 540, 550	600, 620, 580
А2=100	490, 510, 520	550, 540, 560
А3=300	430, 420, 450	470, 460, 430

Необходимо оценить существенность (достоверность) влияния каждого фактора и их взаимодействия на суточный привес поросят.

Рис. 4: Порядок ввода данных

На рисунке 4 порядок ввода данных на рабочий лист табличного процессора Microsoft Excel.

Для вызова необходимой функции необходимо на панели меню выбрать команду Сервис - Анализ данных. На экране раскроется диалоговое окно Анализ данных, в котором следует выбрать значение: Двухфакторный дисперсионный анализ с повторениями и щелкнуть на кнопке ОК. В результате на экране раскроется диалоговое окно Двухфакторный дисперсионный анализ с повторениями, показанное на рисунке 5.

Рис. 5: Диалоговое окно функции

В этом диалоговом окне задаются следующие параметры.

. В поле Входной интервал вводится ссылка на диапазон ячеек, содержащий анализируемые данные. Необходимо выделить ячейки от G 4 до I 13.

. В поле Число строк для выборки определяется число выборок, которое приходится на каждый уровень одного из факторов. Каждый уровень фактора должен содержать одно и то же количество выборок (строк таблицы). В нашем случае число строк равно трем.

. В поле Альфа вводится принятое значение уровня значимости α, которое равно вероятности возникновения ошибки первого рода.

Результаты двухфакторного дисперсионного анализа с помощью функции Двухфакторный дисперсионный анализ с повторениями представлены на рисунке 6.

Рис. 6: Результаты двухфакторного дисперсионного анализа

Очевидно, данные факторы имеют фиксированные уровни, т.е. мы находимся в рамках модели I. Поэтому для проверки существенности влияния факторов А, В и их взаимодействия АВ необходимо найти отношения

и сравнить их с табличными значениями соответственно :=3,88; =: =4,75; =3,88. Так как и то влияние метода содержания поросят (фактора А) и качества их кормления (фактора В) является существенным. В силу того что взаимодействие указанных факторов незначимо (на 5%-ном уровне).

2.3 Решение задач однофакторного дисперсионного анализа

Три группы продавцов продавали штучный товар, расфасованный в различные упаковки. После окончания срока распродажи был произведен тестовый контроль над случайно отобранными продавцами из каждой группы. Были получены следующие результаты:

Номер группы	Число продаж, которые сделали продавцы,	Общее количество продаж	Количество продавцов, nk
1	1 3 2 1 0 2 1	10	7
2	2 3 2 1 4 - -	12	5
3	4 5 3 - - - -	12	3

Если число выборок m=3, число продаж во всех выборках n=15, то:

Если

тогда

Q=104-15·2,226 ²=26,93 ,

Q₁=91,074-15·2,226 ²=14,01,

Q₂=Q-Q₁=26,93-14,01=12,92.

Вычислим критерий Фишера

Сравнивая это значение с табличным F > F_0,05;2;12 =3,885, делаем вывод, что упаковка влияет на количество распродаж.

Вывод

В результате проделанной работы я выяснила следующее.

Анализ производится следующим образом:

. Группируют совокупность наблюдений по факторному признаку

. Находят среднее значение результата и дисперсию по каждой группе.

Существует две модели дисперсионного анализа:

· с фиксированными уровнями факторов,

· со случайными факторами.

Основными схемами организации исходных данных с двумя и более факторами являются:

· перекрестная классификация, которая характерная для моделей с фиксированными уровнями факторов

· иерархическая (гнездовая) классификация, характерная для моделей со случайными факторами.

В основе дисперсионного анализа лежит разделение дисперсии на части или компоненты. Внутригрупповая дисперсия объясняет влияние неучтенных при группировке факторов, а межгрупповая дисперсия объясняет влияние факторов группировки на среднее значение по группе.

Однофакторный дисперсионный анализ используется для сравнения средних значений для трех и более выборок.

Недостаток: невозможно выделить те выборки, которые отличаются от других. Для этой цели необходимо использовать метод Шеффе или проводить парные сравнения выборок.

Многофакторный дисперсионный анализ, помимо функций однофакторного дисперсионного анализа, оценивает межфакторное взаимодействие.

Список используемой литературы

1. Орлов А.И. «Математика случая: Вероятность и статистика - основные факты» Учебное пособие. - М.: МЗ-Пресс, 2004. - 110 с.

2. Ветров А.А., Ломовацкий Г.И. - «Дисперсионный анализ в экономике» 1975. 120 с

. Шеффе Г. «Дисперсионный анализ» - М.: Наука, 1980. -512 c.

. http://bono-esse.ru/blizzard/Medstat/Statan/stat_da.html

. http://dic.academic.ru

Применение методов дисперсионного анализа в экономике