Лекція 3

Кореляційний аналіз. Визначення залежності між двома вимірюванними показниками. Коефіцієнт кореляції. Взаємозв'язок між двома вимірюваними величинами, форма та спрямованість взаємозв'язку. Кореляційне поле. Знаходження найбільш імовірних лінійних залежностей між двома факторами (побудова прямих регресій).

У спортивних дослідженнях між досліджуваними показниками часто спостерігається  взаємозв'язок. Вид його  може бути різним. Розрізняють два види взаємозв'язку: функціональний і стохастичні.

Функціональний  взаємозв'язок‑ це залежність, при якій кожному значенню одного показника відповідає строго визначене значення іншого і ні якої варіації бути не може.

До другого виду взаємозв'язку належить, наприклад, залежність маси тіла від довжини тіла. Одному значенню довжини тіла може відповідати декілька значень маси тіла і навпаки. У таких випадках, коли одному значенню одного показника відповідає декілька значень іншого показника, взаємозв'язок називається стохастичним.

Вивченню статистичного взаємозв'язку між різними показниками в спортивних дослідженнях приділяють велику увагу, тому що це дозволяє розкрити деякі закономірності і надалі описати їх як за допомогою слів, так і математичних знаків та формул, з метою застосування в практичній роботі тренера і педагога.

Серед статистичних взаємозв'язків найбільш важливі ‑ кореляційні (від латинського Correlatio - співвідношення, відповідність).

Кореляція - вид взаємозв'язку між ознаками. Кожна ознака являє собою велику кількість однотипних показників, що варіюють.

Кореляція полягає в тому, що середня величина одного показника змінюється в залежності від середньої величини іншого.

Статистичний метод, що застосовується для дослідження взаємозв'язків,  називається кореляційним аналізом. Головне завдання кореляційного аналізу - визначення форми, щільності, спрямованості досліджуваних показників. Він широко застосовується в теорії тестів для оцінки їхньої надійності й інформативності.

За допомогою кореляційного аналізу можна оцінити:

1.Взаємозв'язок між спортивними результатами і функціональними показниками (результат у бігу на 100 м і кількість лактату в крові);

2.Вплив спортивної діяльності на результат (результат у човниковому бігу 3×100 м і результат у бігу на 100 м);

3.Взаємний вплив показників тренованості (результат при проходженні 10×200 м і результат при проходженні середньої дистанції, у плаванні);

4.Надійність тесту (погодженість, стабільність);

5.Інформативність тесту (залежність між кількістю гребків за 30 секунд і часом проходження дистанції 100 м у плаванні).

Аналіз взаємозв'язку починається із графічного представлення результатів вимірів у прямокутній системі координат. Графічна залежність має назву «діаграма розсіювання» або «кореляційне поле». Візуальний аналіз кореляційного поля дозволяє виявити спрямованість і форму залежності (принаймні, зробити припущення).

За кореляційним полем можна визначити спрямованість:

а) пряма позитивна кореляційна статистична залежність (нахил кореляційного поля вправо) (рис. 2). Зі зростанням (зменшенням) першої ознаки (Хі) інший (Уі) також зростає (зменшується).

б) обернено-негативна кореляційна статистична залежність (нахил кореляційного поля вліво) (рис. 3). Зі зростанням першої ознаки (Хі) інший (Уі) зменшується і навпаки, зі зменшенням першої ознаки (Хі) інший (Уі) зростає.

Якщо кореляційне поле подане окружністю, то залежність відсутня (рис. 4).

Рис. 2. Пряма позитивна кореляційна статистична залежність

Рис. 3. Обернено-негативна кореляційна статистична залежність

Рис. 4. Статистична залежність відсутня

Якщо кореляційне поле подане прямою лінією, то має місце функціональна залежність

Форми статистичної залежності:

1. Лінійна форма залежності ‑ форма є близькою до звичайної геометричної фігури - еліпсу.

2. Нелінійна форма залежності ‑ будь-яка інша форма, крім еліпса.

Отже, візуальний аналіз кореляційного поля дозволяє виявити форму статистичної залежності ‑ лінійну або нелінійну. Це має істотне значення для наступного кроку в аналізі ‑ вибору й обчисленні відповідного коефіцієнта кореляції.

Для більш точної оцінки кореляції, що визначається за формулою, потрібно знати форму залежності:

1. Якщо виміри проводяться за шкалою відношень або інтервалів, і  форма залежності лінійна, то коефіцієнт кореляції розраховується за формулою Браве-Пірсона (rxy)  :

rxy                                           ,  де                                                 

Хі й Уі - варіанти 2-х вибірок;

  і ‑ середнє арифметичне значення показників Хі й Уі;

σх, σу ‑ середнє квадратичне відхилення;

N   ‑ число вимірів (випробуваних).

2. Якщо  виміри проводяться за шкалою відношень або інтервалів, і  форма залежності нелінійна, коефіцієнт кореляції (rxy) розраховується за формулою:

rxy

Для оцінки щільності взаємозв'язку в кореляційному аналізі застосовується значення спеціального показника ‑ коефіцієнта кореляції (rxy).

Абсолютне значення коефіцієнта кореляції знаходиться в межах від 0 до 1 - пряма позитивна кореляційна статистична залежність і від (-1) до 0 - обернена негативна кореляційна статистична залежність:

                                          -1 £rxy£ 1

Пояснюють значення цього коефіцієнта в такий спосіб:

а) rxy = 1 зв'язок між ознаками дуже щільна (функціональний взаємозв'язок);

б) rxy = 0 зв'язок між ознаками Хі й Уі відсутній;

в) чим ближче значення rxy до нуля, тим зв'язок слабкіше, чим ближче значення rxy до одиниці‑- тим щільніше.

Прийнято вважати, що

rxy = 0,2....0,49 ‑ слабкий зв'язок;

rxy = 0,5....0,69 ‑ середній зв'язок;

rxy = 0,7....0,99 ‑ тісний (сильний) зв'язок.

На кореляційному полі щільність може виглядати так:

а) якщо точки групуються вздовж якої-небудь  лінії, то зв'язок є, і він тим щільніше, чим ближче вони групуються.

б) якщо точки розсіяні хаотично, зв'язок між ознаками відсутній або дуже слабкий.

Проте, варто пам'ятати, що при роботі з великою точністю, наприклад, при оцінці кореляцій спортсменів високої кваліфікації, коефіцієнт кореляції відображає щільний зв'язок, якщо він не менше 0,9.

У деяких випадках щільність взаємозв'язку визначають на підставі коефіцієнта детермінації (D), що розраховують за формулою:

D = r²×100 %

Цей коефіцієнт визначає частину загальної варіації одного показника, що пояснюється варіацією іншого показника. Залишок відсотків варіації від ста пояснюється впливом іншихчинників.

У випадку лінійного взаємозв'язку між двома ознаками (факторами), тобто коли кореляційне поле має форму еліпса, за допомогою коефіцієнта кореляції можна знайти найбільш імовірні лінійні залежності, тобто рівняння регресії, які є рівняннями прямої лінії.

Таких рівнянь два:

у = а1 +ву/х×х - пряме;

х = а2 + вх/в  × у - зворотне,

де   а   і   в   -   коефіцієнти, або параметри, які слід визначити.

Значення коефіцієнтів регресії обчислюється за формулою:

    і  

Коефіцієнт регресії в має розмірність, яка відповідає відношенню розмірностей досліджуваних показників X і У, і той же знак, що й коефіцієнт кореляції.

Коефіцієнт а визначається за  формулою:

а1=- ву/х  ×;

а2=- ву/х  ×

Для того, щоб обчислити цей коефіцієнт, треба просто в рівняннях регресії підставити середні значення змінних величин, які корелюють.

Для оцінки точності рівняння регресії розраховується залишкове середнєквадратичневідхилення за формулою:

Ці оцінки абсолютні і, отже, не можуть бути порівнянні один з одним. Тому застосовують оцінки відносної похибки рівнянь, які мають бути виражені у відсотках і визначаються за формулою:

Значення цієї оцінки, якщо r = ±1,00, дорівнює нулю і, якщо r = 0,00, максимальне.

Залишкове середнєквадратичневідхилення характеризує коливання У, щодо лінії регресії з X у прямому рівнянні регресії і, навпаки, у оберненому випадку.

Ostatnia modyfikacja: Monday, 13 March 2017, 10:17