Лекція 5
Дисперсійний аналіз. Вивчення впливу факторної ознаки, залежно від її градацій, на результативну ознаку в практиці спортивної діяльності. Оцінка тренувальних впливів. Вплив умов спортивної діяльності.
Дисперсійний аналіз ‑ це статистичний метод, за допомогою якого можна встановити вплив однієї ознаки на іншу. На відміну від кореляційного аналізу, де також визначається вплив ознак, розглядається їх більш складна структура.
Дисперсійний аналіз має перевагу надкореляційним: тут можна врахувати вплив ознаки, що не має кількісного вираження.
Ознака, що підлягає дослідженню, називається результативною (R).
Вона випробовує на собі вплив факторної ознаки F, чия структура підрозділяється на ряд підгруп, так званих градацій фактору.
Для дослідження залежності результативної ознаки від факторної обирається спеціальна вибірка, яка називається дисперсійним комплексом, із загальним числом елементів N.
Вихідні позиції методу базуються на сумі квадратів відхилень варіантів від їх середньої:
, де (1)
S - сума квадратів відхилень;
Xi - варіанта вихідного ряду
ni- частота вихідного ряду;
- середнє арифметичне значення вихідного ряду.
Встановлено, що сума квадратів відхилень на всій результативній ознаці Sy складається із двох додатків:
Sy = Sx + Sz (2)
де Sx - сума квадратів відхилень, обумовлена варіацією середніх арифметичних усередині градації, щодо середньої арифметичної всього комплексу.
Ця варіація враховує вплив досліджуваного фактору на результативну ознаку.
Sz‑ сума квадратів відхилень, обумовлена варіацією вихідних даних, щодо середніх арифметичних усередині кожної градації.
Ця варіація обумовлена впливом так званих випадкових причин, тобто причин, не пов'язаних з дією фактору.
Рівняння (2) є основним рівнянням дисперсійного аналізу.
Таким чином, після визначення значення Sx, Sy, Sz стає можливим оцінити загальну варіацію результативної ознаки (Sy) і її складові частини: варіацію, яка обумовлена факторною ознакою (Sx), і варіацію від випадкових причин (Sz).
Надалі необхідно перейти до порівняльного аналізу суми квадратів відхилень Sx і Sz. Аналіз проводиться за допомогою критерію Фішера.
Якщо значення варіацій, обумовлених факторною ознакою й випадковими причинами, відрізняються статистично - вірогідно, то прийдемо до висновку, що розглянута факторна ознака впливає на результативну ознаку.
У практичному використанні градації факторної ознаки помітні між собою кількісно, у якісному ж відношенні вони являють собою однозначну характеристику.
Наприклад, оцінюючи вплив вікового розвитку дітей на який-небудь показник, дисперсійний комплекс складається з результативної ознаки (досліджуваний показник) і факторної (вік дітей). При цьому вік дітей, які підлягають дослідженню, доречно розділити за віковими категоріями:
10-12 років; 13-14 років; 14-16 років, тощо.
Вони й будуть являти собою градації фактору.
Якщо задачі ускладнюються, і факторна ознака змінює свою структуру у якісному відношенні, розглядають дисперсійний аналіз двох, трьох і тощо, багатофакторних комплексів.
Практична реалізація дисперсійного аналізу:
1. Оцінка тренувальних впливів: якщо розглядати спортивний результат, або яку-небудь кількісну характеристику результату, як результативну ознаку, то обсяг тренувального навантаження, її інтенсивність або співвідношення обсягу й інтенсивності можна розглядати, як факторну ознаку.
Градаціями фактору в цьому випадку виступають різні кількісні межі обсягу і інтенсивності навантажень або їх співвідношень.
Використовуючи дисперсійний аналіз, можна оцінити вплив ознаки на кінцевий результат спортивної діяльності.
2. Вплив умов спортивної діяльності: під умовами спортивної діяльності будемо розуміти різноманітні види робіт з учасниками досліджень:
Різні програми, методики, режими, види робіт спортивних спеціалізацій, умови експерименту.
Параметр спортивної діяльності приймається, як результативна ознака.
Факторною ознакою є умови роботи спортсмена, що відрізняються різними кількісними межами - градаціями фактору.
Застосування дисперсійного аналізу приводить до оцінки впливу різноманітних умов роботи на параметр спортивної діяльності, який підлягає дослідженню.
3. Вплив біологічного й соціального факторів: у якості факторної ознаки зручно представити різноманітні біологічні й соціальні фактори: - вік, стать, різні медичні групи випробуваних, відношення до спорту, соціальні групи населення, професійні особливості.
Вихідними даними дисперсійного аналізу будемо вважати Xі - вимір практичних спортивних величин і їхньої частоти nі.
Величини Xi вимірюються за умов дії на випробуваних факторної ознаки F, що має градації F1, F2,....Fn.
Градації помітні за кількісними характеристиками. При виконанні статистичних операцій дисперсійного аналізу, в першу чергу, визначаються суми квадратів відхилень за формулами:
, де (3)
Sy - загальна сума квадратів відхилень варіантів результативної ознаки;
Xi - варіанти результативної ознаки;
N - обсяг усього дисперсійного комплексу.
, (4) де
Sx - сума квадратів відхилень варіантів результативної ознаки, обумовлена впливом фактору;
і = 1,2, ....., N;
N - обсяг дисперсійного комплексу;
j = 1, 2,..., f - кількість градацій;
k - обсяг кожної градації дисперсійного комплексу.
, де (5)
Sz - сума квадратів відхилень варіантів результативної ознаки, щообумовлена впливом випадкових причин;
j = 1, 2,..., f;
f - кількість градацій.
Для визначення Sx, Sy, Sz у практичних задачах необхідно вихідні дані й проміжні обчислення зосередити в таблиці (дивись таблицю у прикладі).
Визначивши Sx, Sy, Sz, необхідно переконатися у виконанні основного рівняння дисперсійного аналізу:
Sy = Sx + Sz, після чого, можна приступити до загальної оцінки впливу факторної ознаки на результативний за допомогою загальної суми квадратів відхилень і її складових.
Надалі приступаємо до оцінки впливу факторної ознаки на результативний за допомогою оцінки на статистичну вірогідність.
Критерій Фішера, що аналізує статистичну вірогідність (невірогідність), визначається, як частка від ділення порівнюваних дисперсій.
Таким чином, порівнюючи вплив факторної ознаки й випадкових причин, необхідно визначити дисперсії результативної ознаки, що залежать від фактору і випадку.
Для їхнього визначення необхідно знайти відповідні ступені свободи:
kу= N - 1;
kx = j - 1; (6)
kz = (N - 1) - (j - 1) = N - J, де
kу- ступені свободи загальної дисперсії;
kx- ступені свободи дисперсії, яка обумовлена фактором;
kz- ступені свободи дисперсії, яка обумовлена випадковими причинами.
Дисперсії визначаються як:
; ; (7)
Тепер визначимо критерій Фішера:
, де (8)
і - дисперсії від факторної ознаки й від випадкових причин. Відповідно до вимог критерію Фішера, у чисельнику перебуває більша із цих дисперсій (>)
Критерій, що розрахували, порівнюється з Frp - граничним значенням критерію, який визначається за таблицею Фішера за ступенями свободи kх і kz і надійністю Р.
Проводимо порівняння F і Fгp і робимо висновок:
1якщо F > Fгp - розходження між впливом від факторної ознаки і від випадкових причин статистично вірогідне, тобто фактор, який підлягає дослідженню впливає на результативну ознаку;
2якщо F < Fгp - розходження статистично не вірогідне, і фактор, який підлягає дослідженнюне робить принципового впливу на результативну ознаку.
Оцінити ступінь впливу фактору,який підлягає дослідженнюна результативну ознаку можна за допомогою наступного показника:
Величина, розрахована за цією формулою, зазначає який відсоток варіації результативної ознаки визначається впливом фактору, який підлягаєдослідженню.