Тема 12. Визначення найбільш ймовірних лінійних залежностей між двома факторами
Побудування лінії регресії методом найменших квадратів. Рівняння ліній регресії. Лінія тренду. Величина вірогідності апроксимації (коефіцієнт детермінації). Пряма і зворотна залежності. Визначення точності прямого та зворотного рівнянь регресії.
У спортивних дослідженнях між досліджуваними показниками часто спостерігається взаємозв'язок. Вид його може бути різним. Розрізняють два види взаємозв'язку: функціональний і стохастичні.
Функціональний взаємозв'язок‑ це залежність, при якій кожному значенню одного показника відповідає строго визначене значення іншого і ні якої варіації бути не може.
До другого виду взаємозв'язку належить, наприклад, залежність маси тіла від довжини тіла. Одному значенню довжини тіла може відповідати декілька значень маси тіла і навпаки. У таких випадках, коли одному значенню одного показника відповідає декілька значень іншого показника, взаємозв'язок називається стохастичним.
Вивченню статистичного взаємозв'язку між різними показниками в спортивних дослідженнях приділяють велику увагу, тому що це дозволяє розкрити деякі закономірності і надалі описати їх як за допомогою слів, так і математичних знаків та формул, з метою застосування в практичній роботі тренера і педагога.
Серед статистичних взаємозв'язків найбільш важливі ‑ кореляційні (від латинського Correlatio - співвідношення, відповідність).
Кореляція - вид взаємозв'язку між ознаками. Кожна ознака являє собою велику кількість однотипних показників, що варіюють.
Кореляція полягає в тому, що середня величина одного показника змінюється в залежності від середньої величини іншого.
Статистичний метод, що застосовується для дослідження взаємозв'язків, називається кореляційним аналізом. Головне завдання кореляційного аналізу - визначення форми, щільності, спрямованості досліджуваних показників. Він широко застосовується в теорії тестів для оцінки їхньої надійності й інформативності.
За допомогою кореляційного аналізу можна оцінити:
1.Взаємозв'язок між спортивними результатами і функціональними показниками (результат у бігу на 100 м і кількість лактату в крові);
2.Вплив спортивної діяльності на результат (результат у човниковому бігу 3×100 м і результат у бігу на 100 м);
3.Взаємний вплив показників тренованості (результат при проходженні 10×200 м і результат при проходженні середньої дистанції, у плаванні);
4.Надійність тесту (погодженість, стабільність);
5.Інформативність тесту (залежність між кількістю гребків за 30 секунд і часом проходження дистанції 100 м у плаванні).
Аналіз взаємозв'язку починається із графічного представлення результатів вимірів у прямокутній системі координат. Графічна залежність має назву «діаграма розсіювання» або «кореляційне поле». Візуальний аналіз кореляційного поля дозволяє виявити спрямованість і форму залежності (принаймні, зробити припущення).
За кореляційним полем можна визначити спрямованість:
а) пряма позитивна кореляційна статистична залежність (нахил кореляційного поля вправо) (рис. 2). Зі зростанням (зменшенням) першої ознаки (Хі) інший (Уі) також зростає (зменшується).
б) обернено-негативна кореляційна статистична залежність (нахил кореляційного поля вліво) (рис. 3). Зі зростанням першої ознаки (Хі) інший (Уі) зменшується і навпаки, зі зменшенням першої ознаки (Хі) інший (Уі) зростає.
Якщо кореляційне поле подане окружністю, то залежність відсутня (рис. 4).
Рис. 2. Пряма позитивна кореляційна статистична залежність
Рис. 3. Обернено-негативна кореляційна статистична залежність
Рис. 4. Статистична залежність відсутня
Якщо кореляційне поле подане прямою лінією, то має місце функціональна залежність
Форми статистичної залежності:
1. Лінійна форма залежності ‑ форма є близькою до звичайної геометричної фігури - еліпсу.
2. Нелінійна форма залежності ‑ будь-яка інша форма, крім еліпса.
Отже, візуальний аналіз кореляційного поля дозволяє виявити форму статистичної залежності ‑ лінійну або нелінійну. Це має істотне значення для наступного кроку в аналізі ‑ вибору й обчисленні відповідного коефіцієнта кореляції.
Для більш точної оцінки кореляції, що визначається за формулою, потрібно знати форму залежності:
1. Якщо виміри проводяться за шкалою відношень або інтервалів, і форма залежності лінійна, то коефіцієнт кореляції розраховується за формулою Браве-Пірсона (rxy) :
rxy , де
Хі й Уі - варіанти 2-х вибірок;
і ‑ середнє арифметичне значення показників Хі й Уі;
σх, σу ‑ середнє квадратичне відхилення;
N ‑ число вимірів (випробуваних).
2. Якщо виміри проводяться за шкалою відношень або інтервалів, і форма залежності нелінійна, коефіцієнт кореляції (rxy) розраховується за формулою:
rxy
Для оцінки щільності взаємозв'язку в кореляційному аналізі застосовується значення спеціального показника ‑ коефіцієнта кореляції (rxy).
Абсолютне значення коефіцієнта кореляції знаходиться в межах від 0 до 1 - пряма позитивна кореляційна статистична залежність і від (-1) до 0 - обернена негативна кореляційна статистична залежність:
-1 £rxy£ 1
Пояснюють значення цього коефіцієнта в такий спосіб:
а) rxy = 1 зв'язок між ознаками дуже щільна (функціональний взаємозв'язок);
б) rxy = 0 зв'язок між ознаками Хі й Уі відсутній;
в) чим ближче значення rxy до нуля, тим зв'язок слабкіше, чим ближче значення rxy до одиниці‑- тим щільніше.
Прийнято вважати, що
rxy = 0,2....0,49 ‑ слабкий зв'язок;
rxy = 0,5....0,69 ‑ середній зв'язок;
rxy = 0,7....0,99 ‑ тісний (сильний) зв'язок.
На кореляційному полі щільність може виглядати так:
а) якщо точки групуються вздовж якої-небудь лінії, то зв'язок є, і він тим щільніше, чим ближче вони групуються.
б) якщо точки розсіяні хаотично, зв'язок між ознаками відсутній або дуже слабкий.
Проте, варто пам'ятати, що при роботі з великою точністю, наприклад, при оцінці кореляцій спортсменів високої кваліфікації, коефіцієнт кореляції відображає щільний зв'язок, якщо він не менше 0,9.
У деяких випадках щільність взаємозв'язку визначають на підставі коефіцієнта детермінації (D), що розраховують за формулою:
D = r²×100 %
Цей коефіцієнт визначає частину загальної варіації одного показника, що пояснюється варіацією іншого показника. Залишок відсотків варіації від ста пояснюється впливом іншихчинників.
У випадку лінійного взаємозв'язку між двома ознаками (факторами), тобто коли кореляційне поле має форму еліпса, за допомогою коефіцієнта кореляції можна знайти найбільш імовірні лінійні залежності, тобто рівняння регресії, які є рівняннями прямої лінії.
Таких рівнянь два:
у = а1 +ву/х×х - пряме;
х = а2 + вх/в × у - зворотне,
де а і в - коефіцієнти, або параметри, які слід визначити.
Значення коефіцієнтів регресії обчислюється за формулою:
і
Коефіцієнт регресії в має розмірність, яка відповідає відношенню розмірностей досліджуваних показників X і У, і той же знак, що й коефіцієнт кореляції.
Коефіцієнт а визначається за формулою:
а1=- ву/х ×;
а2=- ву/х ×
Для того, щоб обчислити цей коефіцієнт, треба просто в рівняннях регресії підставити середні значення змінних величин, які корелюють.
Для оцінки точності рівняння регресії розраховується залишкове середнєквадратичневідхилення за формулою:
Ці оцінки абсолютні і, отже, не можуть бути порівнянні один з одним. Тому застосовують оцінки відносної похибки рівнянь, які мають бути виражені у відсотках і визначаються за формулою:
Значення цієї оцінки, якщо r = ±1,00, дорівнює нулю і, якщо r = 0,00, максимальне.
Залишкове середнєквадратичневідхилення характеризує коливання У, щодо лінії регресії з X у прямому рівнянні регресії і, навпаки, у оберненому випадку.