|
|
-5
|
-2
|
0
|
3
|
4
|
5
|
7
|
10
|
|
|
-31
|
-13
|
-2
|
12
|
16
|
20
|
30
|
40
|
Оценим математические ожидания, дисперсии, среднее квадратические
отклонения и коэффициент корреляции случайных величин
и
.
Математические ожидания:
корреляционный регресионный математический
дисперсия

и 
;
Несмещенные дисперсии:
и
;
Смещенные дисперсии:

и 
;
Несмещенные средние квадратические отклонения:
и
;
Смещенные средние квадратические отклонения:
и
; 
Подставив исходные данные, получаем
. Оценка ковариации
, поэтому можно утверждать, что между
переменными существует прямая зависимость.
Теперь используем полученные данные оценки ковариации в нахождении
коэффициента корреляции:
. Оценка коэффициента корреляции характеризует силу связи
между параметрами. Так как
устанавливаем, что сила связи между
и
весьма высокая. Определение оценки
коэффициента корреляции дает возможность проверки гипотезы о наличии линейной
статистической связи. Если гипотеза
о равенстве нулю коэффициента корреляции
будет отвергнута, то соответствующие величины связаны линейным соотношением,
если же она будет принята, тогда устанавливают, что величины линейно не связаны
друг с другом. В данной ситуации
, поэтому гипотеза
отвергается.
Нанесем точки из таблицы на координатную плоскость (Рис. 1 Исходные
данные на координатной плоскости):
Рис. 1 Исходные данные на координатной плоскости
Построим регрессионную модель вида:
.
Построение регрессионной модели заключается в оценивании параметров и
вида функции
, распределения и параметров случайной величины
, поэтому регрессионную модель
записывают в виде:
, где конкретная зависимость
называется эмпирическим уравнением
регрессии.
Для построения регрессионной модели в качестве эмпирического уравнения
регрессии
выберем линейную функцию:
. Если использовать прямой метод
построения линейных регрессионных моделей, тогда необходимо записать
эмпирическое уравнение регрессии следующим образом:
- для уравнения Y на X;
- для уравнения X на Y, где
,
,
,
и
были вычислены заранее.
Подставив все имеющиеся данные, вычисляем уравнение Y на X (Рис. 2 Графический метод построения линейных регрессионных
моделей):
;
Уравнение X на Y (Рис. 2 Графический метод построения
линейных регрессионных моделей):
Рис. 2 Графический метод построения линейных регрессионных моделей
После построения линейных регрессионных моделей в качестве эмпирического
уравнения регрессии
выберем параболу
и, используя метод наименьших
квадратов, находим коэффициенты
, решая систему уравнений:
Уравнение параболической модели:
=-0,0887
+5,1575
-2,6549 (Рис. 3 Графический метод
построения параболической регрессионной модели)
Рис. 3 Графический метод построения параболической регрессионной модели
Теперь оценим среднее квадратическое отклонение
для обеих моделей: и для линейной, и
для параболической.
Линейная модель (l=2, n=8):
1)
,
где l - число неизвестных параметров
функции
;
2)
,
где n - число исходных данных
Параболическая модель (l=3, n=8):
,
подставив данные, получаем:
Для параболической регрессии оценим корреляционное отношение. Прежде чем
это сделать, необходимо оценить величину, называемую коэффициентом детерминации
и характеризующую степень тесноты детерминированной связи:
,
причем
и
. В корреляционном анализе вместо
пользуются оценкой корреляционного
отношения:
, то есть
.
Подставляем в формулу имеющиеся данные и получаем:
.
Результат вычислений сравним с вычисленным ранее значением
. Так как
, в качестве
можно брать нелинейную функцию.
На следующем этапе вычислений найдем доверительный интервал для условного
математического ожидания
с доверительной вероятностью 1-α=0,97 при предположении о нормальном
условном распределении случайной величины Y.
Сначала в качестве эмпирического уравнения регрессии
выберем линейную модель с
.
Для вычисления доверительного интервала воспользуемся формулой:
Итак, имеем следующие данные:
; n=8;
=2,75;
. Так как в таблице квантилей распределения Стьюдента не дано
значения
соответствующего доверительной
вероятности 1-α, вычислим его самостоятельно, используя уравнение прямой,
проходящей через две точки:
.
Выберем в таблице значений
два ближайших значения по отношению к
установленной доверительной вероятности γ=0,97:
и
;
γ=0,95 и γ=0,99
соответственно.
Подставим все имеющиеся данные в уравнение прямой, проходящей через две точки:
, получаем
После нахождения всех необходимых данных строим доверительный интервал
(Рис. 4 Доверительный интервал для условного математического ожидания на основе
линейной регрессионной модели)
Рис. 4 Доверительный интервал для условного математического ожидания на
основе линейной регрессионной модели
Для построения доверительного интервала можно также использовать параболическую
модель с
(Рис. 5 Доверительный интервал для
условного математического ожидания на основе параболической модели)
Рис. 5 Доверительный интервал для условного математического ожидания на
основе параболической модели
В исходных данных приведено значение
, взятое из той же генеральной
совокупности. Рассчитаем доверительный интервал для условного математического
ожидания с доверительной вероятностью γ=0,97, употребляя указанное
:
При использовании линейной модели
, где
,
, а также n=8,
,
и
, получаем следующий доверительный интервал:
-22, 0515
-14,3931
При использовании параболической модели
=0,0887
+5,1575
-2,6549, где
и
, доверительный интервал: -20,129
-17,7224.
Таким образом, устанавливаем, что эти доверительные интервалы накрывают
истинное среднее значение изменения общего дохода филиала (в %) с вероятность
0,97. Можно сказать, что истинное среднее значение находится в этом интервале
(интервале, вычисленном по линейной модели или по параболической).
Регрессионные модели используются для косвенного оценивания значения
по информации о значении
, то есть при подстановке
в выражение
мы оценили только среднее значение
величины y с некоторым доверительным интервалом:
-22, 0515
-14,3931 (линейная регрессионная
модель), -20,129
-17,7224 (параболическая регрессионная модель).
Для того, чтобы получить оценку индивидуального значения
необходимо определить толерантный
интервал, в который с заданной вероятностью р=0,95 и γ
=0,97 попадает значение
:
,
где 
,
- квантиль условного распределения
, находящиеся по таблице.
Ф (
)=
,
то есть, используя таблицу, устанавливаем, что
=1,96.
Если в качестве регрессионной модели берется линейная модель
, где
и
, тогда толерантный интервал: -26,555
<
< -9,8896.
Для нахождения толерантного интервала можно также использовать
параболическую регрессионную модель
=0,0887
+5,1575
-2,6549 с
и
. В этом случае толерантный интервал
примет следующий вид: -21,5443 <
< -16,3071.
Из проведенного выше анализа, можно сделать следующие выводы: изменение
объема продаж бытовой техники и изменение общего дохода филиала торговой сети
тесно взаимосвязаны. В ходе интервального оценивания было выяснено, что при
выполнении предсказания аналитиков, а именно спад объема продаж бытовой техники
в 2011 году на 3%, приведут к уменьшению общего дохода. Используя результаты
вычислений, с указанными ранее вероятностями, на основе линейной регрессионной
модели, можно установить, что уменьшение дохода будет находиться в диапазоне от
9,5% (точнее 9,8896%) до 26,5% (точнее 26,555%), по данным параболической
регрессионной модели - от 16,3% (точнее 16,3071%) до 21,5% (точнее 21,5443%).
Источники и
литература
. Маслов В.Н. Теория вероятностей и математическая
статистика: Учебное пособие. - ВВАГС, 1999.;
. Гмурман В.Е. Руководство к решению задач по теории
вероятностей и математической статистике: учеб. пособие. - 11-е изд., перераб.
- М.: Высшее образование, 2008.;
3. Колемаев В.А., Калинина В.Н. Теория вероятностей и
математическая статистика: Учебник / Под ред. В.А. Колемаева. - М.: ИНФРА-М,
1997.;
4. Статья "Применение корреляционно-регрессионного
метода в анализе финансового состояния организации"