Методи математичної статистики. Регресійний аналіз
Використовувати термін множинний регресійний аналіз почав Пірсон (Pearson) у своїх роботах, датованих ще 1908 роком. Він описав його на прикладі роботи агента, що здійснює продаж нерухомості. У своїх записах фахівець з торгівлі будинками вів облік широкого спектра вихідних даних кожного конкретного будови. За результатами торгів визначалося, який чинник мав найбільший вплив на ціну угоди.
Аналіз великої кількості угод дав цікаві результати. На кінцеву вартість впливали багато чинників, іноді приводячи до парадоксальних висновків і навіть до явних «викидам», коли будинок з високим початковим потенціалом продавався за заниженим ціновим показником.
Другим прикладом застосування такого аналізу наведена робота спеціаліста з кадрів, якому було довірено визначення винагороди співробітникам. Складність завдання полягала в тому, що потрібна не роздавання фіксованої суми кожному, а сувору відповідність її величини конкретно виконану роботу. Появу безлічі завдань, що мають практично подібний варіант рішення, зажадало більш детального їх вивчення на математичному рівні.
В математичній статистиці істотне місце було відведено під розділ «регресійний аналіз», в ньому об`єдналися практичні методи, використовувані для дослідження залежностей, які підпадають під поняття регресійних. Ці взаємозв`язки спостерігаються між даними, отриманими в ході статистичних досліджень.
Регресійний аналіз серед безлічі вирішуваних завдань основними ставить перед собою три мети: визначення для рівняння регресії загального виду- побудова оцінок параметрів, які є невідомими, які входять до складу рівняння регрессіі- перевірка статистичних регресійних гіпотез. У ході вивчення зв`язку, що виникає між парою величин, отриманих в результаті експериментальних спостережень і складових ряд (безліч) типу (x1, y1), ..., (xn, yn), спираються на положення теорії регресії і припускають, що для однієї величини Y спостерігається певне імовірнісний розподіл, при тому, що інше X залишається фіксованим.
Результат Y залежить від значення змінної X, залежність ця може визначатися різними закономірностями, при цьому на точність отриманих результатів впливає характер спостережень і мета аналізу. Експериментальна модель ґрунтується на певних припущеннях, які є спрощеними, але правдоподібними. Основною умовою є те, що параметр X є величиною контрольованою. Його значення задаються до початку експерименту.
Якщо в ході експерименту використовується пара неконтрольованих величин XY, то регресійний аналіз здійснюється одним і тим же способом, але для інтерпретації результатів, в ході якої вивчається зв`язок досліджуваних випадкових величин, застосовуються методи кореляційного аналізу. Методи математичної статистики не є абстрактній темою. Вони знаходять собі застосування в житті в найрізноманітніших сферах діяльності людини.
У науковій літературі для визначення вище зазначеного методу знайшов широке використання термін лінійний регресійний аналіз. Для змінної X застосовують термін регресорів або предиктор, а залежні Y-змінні ще називають критеріальними. У даній термінології відбивається лише математична залежність змінних, але ніяк не слідчо-причинні відносини.
Регресійний аналіз служить найбільш поширеним методом, який використовується в ході обробки результатів самих різних спостережень. Фізичні та біологічні залежності вивчаються за коштами даного методу, він реалізований і в економіці, і в техніці. Маса інших областей використовують моделі регресійного аналізу. Дисперсійний аналіз, планування експерименту, статистичний аналіз багатовимірний тісно співпрацюють з даними способом вивчення.