Тема 5. Представлення статистичних даних

Емпіричний ряд числових даних, ранжируваний ряд, варіаційний ряд. Графіки розподілу числових даних: залежність варіанти від частоти, кумулята, полігон розподілу, гістограма.

Сучасні спортивні дослідження містять великі масиви вимірів. Отримані в ході експериментальної роботи дані представлені у вигляді неврегульованого набору чисел. Для того, щоб по ним можна було робити якісь виводи, необхідна первинна їх обробка - угрупування. Спеціальні статистичні операції дають можливість сконцентрувати початковий кількісний матеріал, і при цьому не втрачається корисна інформація. З погляду математичної процедури, така робота зводиться до формування деяких математичних систем, основні характеристики яких дають уяву про початковий масив чисел.

Найпопулярніший метод, що дозволяє зробити такі операції ‑ метод середніх величин. Початкова кількісна інформація при ранжируванні переходить у варіаційний ряд. Характеристики варіаційного ряду дають уявлення про початковий масив чисел. Концентрація початкового кількісного матеріалу і представлення його декількома параметрами є основою для подальших досліджень, тому що потім робота проводиться не з усім масивом чисел, а тільки з характеристиками варіаційного ряду.

Робота над методом середніх величин передбачає три основних етапи:

1.Утворення варіаційного ряду.

2.Знаходження основних характеристик варіаційного ряду:

·обсяг вибірки (N);       

·середнє арифметичне значення ();

·медіана (Мех);

·мода (Мох);

·дисперсія (s2);

·середнє квадратичне відхилення (s);

·помилка середнього арифметичного значення (m);

·коефіцієнт варіації (V);

3.      Практична реалізація отриманих характеристик.

Метод середніх величин дає можливість визначити середнє значення, припустимі границі досліджуваної вибірки і визначити правильність добору досліджуваної групи, її однорідність і однотипність. Тільки  правильно підібрана група, однорідна й однотипна може брати участь у подальших дослідженнях. Якщо група правильно підібрана, то результати дослідження можуть бути використані при подальшій оцінці й аналізі методики тренування, ефективності навчально-виховного процесу і т.п. Прикінцевий результат дослідження можна буде вважати результатом проведення навчально-виховної або навчально-тренувальної роботи, а не наслідком закономірної зміни фізичного розвитку, або фізичної підготовленості.

Для того, щоб скласти варіаційний ряд, необхідно виконати ранжирування варіант.

Ранжирування - операція розташування варіант у порядку зростання або зменшення.

Числа, що входять до складу ранжируваного ряду називаються варіантами, варіанта (Хi)- значення ознаки, що спостерігається.

Кожна варіанта в ранжируваному ряду зустрічається визначену кількість разів - частота варіанти (ni).

Частота варіанти - кількість варіант у ранжируваному ряду.

Вибірка (вибіркова сукупність) ‑ ряд результатів, поданих випадковими числами.

Генеральна сукупність - сукупність усіх значень, які можна було б отримати для досліджуваної вибірки.

Якщо дослідженням охоплена вся генеральна сукупність, то таке дослідження називається суцільним. Такі дослідження мають місце дуже рідко.

Наприклад, якщо комусь вдалося обстежити всіх найсильніших спортсменів світу в якомусь виді спорту, тобто провести суцільне дослідження (тому, що інших найсильніших спортсменів світу в досліджуваному виді спорту на момент обстеження не було), виходить, що обстежено всю генеральну сукупність. Усі наступні дослідження будуть вважатися вибірковими (наприклад, дослідження на рівні України).

Наприклад, довжина тіла студентів одного вузу факультету фізичного виховання (якщо нас цікавлять результати студентів щодо показника, який підлягає дослідженню, тільки одного вузу факультету фізичного виховання) ‑ вибіркова сукупність. А довжина тіла студентів усіх факультетів фізичного виховання України - генеральна сукупність.

Обсяг вибірки (N) - одна з основних характеристик варіаційного ряду, що визначається числом об'єктів спостереження або загальної кількості варіант у ранжируваному ряду, що спостерігається.

Варіаційний ряд - ранжируваний ряд з позначкою частоти або відносної частоти.

Накопичена частота (k) - визначається додаванням попередніх частот.

Накопичена частота першої варіанти в ранжируваному ряду дорівнює її ж частоті, а останньої варіанти - загальній кількості варіант досліджуваного ранжируваного ряду, тобто обсягу вибірки (N).

Медіана (Мех) - основна характеристика варіаційного ряду. Вона визначається як середня варіанта, що розподіляє ранжируваний ряд навпіл.

У залежності від парності або непарності обсягу вибірки, медіана розраховується за формулами:

якщо обсяг вибірки непарний: Мех= X((N+1)/2)

якщо обсяг вибірки парний: Мех= (X (N/2) + X ((N/2) +і))

Мода (Мoх) - основна характеристика варіаційного ряду, вона визначається як варіанта з найбільшою частотою.

Якщо дві варіанти ранжируваного ряду мають однакову найбільшу частоту і розташовуються поруч, то мода - середнє арифметичне значення цих двох варіант; якщо розташовані в різних місцях ранжируваного ряду, то існують дві моди, і вибірка називається бімодальною; якщо всі варіанти зустрічаються однакову кількість разів - моди не існує.

Середнє арифметичне значення()-основна характеристика варіаційного ряду, що визначається як середній результат досліджуваної вибірки. Середнє арифметичне значення розраховується за формулою:

Графік залежності варіанти від частоти дає уявлення про нормальний закон розподілу.

Нормальний закон розподілу ‑ закон, при якому переважну більшість варіантів зосереджено в центрі, а по мірі віддалення від центру, кількість їх поступово зменшується, зберігаючи абсолютну симетрію лівого і правого крила нормальної кривої.

Якщо результати вимірів за своїми характеристиками можуть бути віднесені до нормального розподілу, то вибір статистичного методу для аналізу результатів визначений. Це дуже важливо, оскільки для дослідження зменшується ступінь ризику використання неправильного статистичного методу аналізу.

На основі порівняння медіани, моди, середнього арифметичного значення і побудови графіка залежності варіанти від частоти можливо зробити висновок про правильний добір досліджуваної групи.

Якщо результати вимірів за своїми характеристиками можуть бути віднесені до нормального розподілу, то вибір статистичного методу для аналізу результатів визначений. Це дуже важливо, оскільки для дослідження зменшується ступінь ризику використання неправильного статистичного методу аналізу.

На основі порівняння медіани, моди, середнього арифметичного значення і побудови графіка залежності варіанти від частоти можливо зробити висновок про правильний добір досліджуваної групи.

Наприклад: результати легкоатлетів на дистанції 100 м надано у вигляді варіаційного ряду, а =Мех =Мох =12 (с) (рис. 1):

Якщо значення медіани, моди і середнього арифметичного значення збігаються, або незначно відрізняються, і графік залежності варіанти від частоти має форму купола, що дозволяє говорити про нормальний закон розподілу, то досліджувану групу можна вважати правильно підібраною відповідно віку, статі, фізичній підготовленості (для осіб, які не займаються спортом), або віку, статі, спеціалізації, кваліфікації (для спортсменів). Така група може брати участь у подальших дослідженнях. Результати дослідження, які були отримані при правильному доборі групи, можна буде використовувати в подальшій роботі.

Xi, с

nі

10

1

11

1

12

5

13

2

14

1

15

1

Рис. 1.Графік залежності варіанти від частоти

Якщо значення медіани, моди і середнього арифметичного значно відрізняються, а графік залежності варіанти від частоти не має форму купола, і має місце лівостороння, або правостороння асиметрія (розподіл варіант не відповідає нормальному закону), то група підібрана неправильно, і не може брати участь у подальших дослідженнях. Потрібно переглянути склад групи.

Однорідність і однотипність групи визначається за коефіцієнтом варіації (V), який розраховується за формулою:

V= (σ / ) ×100%,   

          де σ ‑ середнє квадратичне відхилення;

‑ середнє арифметичне значення.

Середнє квадратичне відхилення (σ) - основна характеристика варіаційного ряду, яка показує відхилення від середнього арифметичного значення. Чим менше значення σ, тим група більш однорідна й однотипна. За σ можна визначити перевагу тій або іншої методики тренування, розвитку фізичної якості, або підготовленості. За допомогою середнього квадратичного відхилення можна записати припустимі границі ( σ) для досліджуваної вибірки.

Розраховується середнє квадратичне відхилення за формулою:


 де  σ² -  дисперсія.

Дисперсія показує  розсіювання результатів і визначається за формулою:

де Хі - варіанта,  - середнє арифметичне значення, ni - частота варіанти, N - обсяг вибірки.

Помилка середнього арифметичного значення (m) або випадкова помилка вимірів виникає по причинах, що можна проектувати, але не можливо заздалегідь передбачити (погодні умови; напруга в мережі, від якої працює прилад...).

У залежності від обсягу вибірки, помилка середнього арифметичного значення може бути розрахована за формулою:

 m = σ/ , якщо N > 20; або m = σ/ , якщо N £ 20,

де N - обсяг вибірки.

Оцінка однорідності й однотипності проводиться за коефіцієнтом варіації:

якщо V ≤ 10%, то коливання результатів дослідження невелике, групу можна вважати однорідною й однотипною за своїм складом, вона може брати участь у подальших дослідженнях;

якщо V приймає значення від 10 до 20% ‑ середнє коливання результатів, групу не можна вважати однорідною і однотипною, але склад такої групи можливо  переглянути;

якщо V > 20% ‑ коливання результатів велике і така група не однорідна і не однотипна, і не може брати участь у подальших дослідженнях.

Last modified: Friday, 28 January 2022, 1:33 AM