Метод найменших квадратів
Метод
найменших квадратів
У процесі
вивчення різних питань природознавства, економіки і техніки, соціології,
педагогіки доводиться на основі великої кількості дослідних даних виявляти
суттєві фактори, які впливають на досліджуваний об’єкт, а також встановлювати
форму зв’язку між різними зв’язаними одна з одною величинами (ознаками).
Нехай у
результаті досліджень дістали таку таблицю деякої функціональної залежності:
Таблиця 1
|
x
|
x1
|
x2
|
…
|
xn
|
|
y
|
y1
|
y2
|
…
|
yn
|
Треба знайти
аналітичний вигляд функції
, яка добре відображала б цю таблицю дослідних
даних. Функцію
можна
шукати у вигляді інтерполяційного поліному. Але інтерполяційні поліноми не
завжди добре відображають характер поведінки таблично заданої функції. До того
ж значення
дістають у
результаті експерименту, а вони, як правило, сумнівні. У цьому разі задача
інтерполювання табличної функції втрачає сенс. Тому шукають таку функцію
, значення якої при
досить близькі до табличних
значень
. Формулу
називають емпіричною, або рівнянням
регресії
на
. Емпіричні формули мають
велике практичне значення, вдало підібрана емпірична формула дає змогу не тільки
апроксимувати сукупність експериментальних даних, «згладжуючи» значення
величини
, а й
екстраполювати знайдену залежність на інші проміжки значень
.
Процес побудови
емпіричних формул складається з двох етапів: встановлення загального виду цієї
формули і визначення найкращих її параметрів.
Щоб встановити
вигляд емпіричної формули, на площині будують точки з координатами
. Деякі з цих точок сполучають плавною кривою,
яку проводять так, щоб вона проходила якомога ближче до всіх даних точок. Після
цього візуально визначають, графік якої з відомих нам функцій найкраще
підходить до побудованої кривої. Звичайно, намагаються підібрати найпростіші
функції: лінійну, квадратичну, дробово-раціональну, степеневу, показникову,
логарифмічну.
Встановивши
вигляд емпіричної формули, треба знайти її параметри (коефіцієнти). Найточніші
значення коефіцієнтів емпіричної формули визначають методом найменших
квадратів. Цей метод запропонували відомі математики К. Гаусс і А.
Лежандр.
Розглянемо суть
методу найменших квадратів.
Нехай емпірична
формула має вигляд
, (1)
де
,
, …,
- невідомі коефіцієнти. Треба знайти такі
значення коефіцієнтів
,
за яких крива (1) якомога ближче проходитиме до всіх
точок
,
, …,
, знайдених експериментально. Зрозуміло, що
жодна з експериментальних точок не задовольняє точно рівняння (1). Відхилення
від підстановки координат
у рівняння (1) дорівнюватимуть величинам
.
За методом
найменших квадратів найкращі значення коефіцієнтів
ті, для яких сума квадратів відхилень
(2)
дослідних даних
від обчислених за
емпіричною формулою (1) найменша. Звідси випливає, що величина (2), яка є
функцією від коефіцієнтів
, повинна мати мінімум. Необхідна умов мінімуму
функції багатьох змінних ─ її частинні похідні мають дорівнювати нулю,
тобто
,
, …,
.
Диференціюючи
вираз (2) по невідомих параметрах
, матимемо відносно них систему рівнянь:

Система (3)
називається нормальною. Якщо вона має розв’язок, то він єдиний, і буде
шуканим.
Якщо емпірична
функція (1) лінійна відносно параметрів
, то нормальна система (3) буде системою з
лінійних рівнянь відносно
шуканих параметрів.
Будуючи емпіричні
формули, припускатимемо, що експериментальні дані
додатні.
Якщо серед
значень
і
є від’ємні, то завжди можна
знайти такі додатні числа
і
, що
і
.
Тому
розв’язування поставленої задачі завжди можна звести до побудови емпіричної
формули для додатних значень
.
Побудова
лінійної емпіричної формули. Нехай між даними
існує лінійна залежність. Шукатимемо емпіричну
формулу у вигляді
, (4)
де коефіцієнти
і
невідомі.
Знайдемо значення
і
, за яких функція
матиме мінімальне значення. Щоб
знайти ці значення, прирівняємо до нуля частинні похідні функції
Звідси,
врахувавши, що
, маємо
(5)
Розв’язавши
відносно
і
останню систему, знайдемо
, (6)
. (7)
Зазначимо, що,
крім графічного, є ще й аналітичний критерій виявлення лінійної залежності між
значеннями
і
.
Покладемо
,
,
.
Якщо
, то залежність між
і
лінійна, бо точки
лежатимуть на одній прямій. Якщо
, то між
і
існує майже лінійна залежність, оскільки точки
лежатимуть близько до
деякої прямої.
Побудова
квадратичної емпіричної залежності. Нехай функціональна залежність між
та
- квадратична. Шукатимемо емпіричну формулу у
вигляді
. (8)
Тоді формулу (2)
запишемо наступним чином
Для знаходження
коефіцієнтів
,
,
, за яких функція
мінімальна, обчислимо частинні похідні
,
,
і прирівняємо їх до нуля. В результаті
дістанемо систему рівнянь
Після
рівносильних перетворень маємо систему
(9)
Розв’язок цієї
системи і визначає єдину параболу, яка краще від усіх інших парабол (8) подає
на розглядуваному проміжку задану таблично функціональну залежність.
Сформулюємо
аналітичний критерій для квадратичної залежності. Для цього введемо поділені
різниці першого і другого порядку
і
, де
.
Точки
розміщені на параболі (8)
тоді і тільки тоді, коли всі поділені різниці другого порядку зберігають сталі
значення.
Якщо точки
рівновіддалені, тобто
, то для існування
квадратичної залежності (8) необхідно і достатньо, щоб була сталою скінчена
різниця другого порядку
,
причому
.
Побудова
емпіричних формул найпростіших нелінійних залежностей. Нехай у системі координат
маємо нелінійну залежність
, неперервну і монотонну на
відрізку
.
Введемо змінні
,
так, щоб у новій системі координат
задана емпірична нелінійна
залежність стала лінійною
. (10)
Тоді точки з
координатами
в площині
лежатимуть на прямій
лінії.
Покажемо, як від
нелінійних залежностей
, 2)
, 3)
,
, 5)
, 6)
перейти до
лінійних.
1) Розглянемо
степеневу залежність
,
де
,
,
.
Логарифмуючи її,
знаходимо
. Звідси,
поклавши
,
,
,
, маємо
.
2) Логарифмуючи
показникову залежність
,
маємо
. Поклавши
,
,
,
в системі координат
дістанемо залежність (10).
3) Щоб перейти від
логарифмічної залежності
до
лінійної
, досить
зробити підстановку
,
.
4) У
гіперболічній залежності замінимо змінні
,
. Тоді гіперболічна залежність перетвориться в
лінійну (10), в якій
,
.
5) Розглянемо
дробово-лінійну функцію
.
Знайдемо обернену функцію
. Тоді ввівши нові координати
,
, дістанемо лінійну залежність (10), де
,
.
6) Нехай маємо
дробово-раціональну залежність
. Оберненою до неї буде залежність
. Ввівши нові змінні
,
, дістанемо лінійну залежність (10) з коефіцієнтами
,
.
Отже, для
побудови будь-якої з емпіричних формул 1)-6) треба:
а) за вихідною
таблицею даних
побудувати
нову таблицю
,
використавши відповідні формули переходу до нових координат;
б) за новою
таблицею даних знайти методом найменших квадратів коефіцієнти
і
лінійної функції (10);
в) за
відповідними формулами знайти коефіцієнти
і
даної нелінійної залежності.
Вибрати емпіричну
формулу для нелінійних залежностей графічним методом часто буває важко. Тоді
вдаються до перевірки аналітичних критеріїв існування певної залежності. Для цього
зводять її до лінійної і перевіряють виконання критерію лінійної залежності між
перетвореними вихідними даними
. Але є й власні аналітичні критерії наявності
кожної з розглянутих вище нелінійних залежностей. Найпростіші необхідні умови
їх наявності подано в табл. 2.
Таблиця 2
|
№ пор.
|
Емпірична формула
|
|
|
Спосіб вирівнювання
|
|
1
|
|
|
|
|
|
2
|
|
|
|
, де ,
, ,
|
|
3
|
|
|
|
, де ,
,
|
|
4
|
|
|
|
, де
|
|
5
|
|
|
|
, де
|
|
6
|
|
|
|
, де
|
|
7
|
|
|
|
, де ,
|
Умови перевіряють
у такий спосіб. На заданому відрізку зміни
незалежної змінної
вибирають
дві точки, досить надійні і розміщені якомога далі одна від одної. Нехай,
наприклад, це будуть точки
,
. Потім, залежно від типу емпіричної формули,
що перевіряється, обчислюють значення
, яке є або середнім арифметичним, або середнім
геометричним, або середнім гармонічним значень
,
. Маючи значення
і
аналогічно обчислюють і відповідне значення
. Далі, користуючись даною
таблицею значень
, для
значення
знаходять
відповідне йому значення
.
Якщо
немає в таблиці,
то
знаходять наближено
з побудованого графіка даної залежності або за допомогою лінійної інтерполяції
, де
і
─ проміжні значення, між якими лежить
. Обчисливши
, знаходять величину
. Якщо ця величина велика, то
відповідна емпірична формула не придатна для апроксимації заданих табличних
даних. З кількох придатних емпіричних формул перевагу надають тій, для якої
відхилення
якомога
менше.