ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ У ПЕДАГОГІЧНИХ ДОСЛІДЖЕННЯХ

ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ У ПЕДАГОГІЧНИХ ДОСЛІДЖЕННЯХ

Статистичні методи застосовуються під час обробки матеріалів психолого-педагогічних досліджень для того, щоб вилучити з одержаних кількісних даних якнайбільше корисної інформації. Доречне застосування цих методів дозволить досліднику, провівши початкову обробку, одержати загальну картину того, що дають кількісні результати його досліджень, оперативно проконтролювати хід досліджень.

Надмірне захоплення статистикою може навіть за-шкодити, якщо аналіз і встановлення причинно-наслідкових зв’язків замінюється набором цифр, складних формул і посилань на різні математичні таблиці. Не до всіх видів одержаних даних можна застосувати певні статистичні процедури. У статистичних розрахунках завжди є певна міра умовності, припущення. Статистичні методи розкривають зв’язки між досліджуваними явищами. Однак необхідно знати, що якою б високою не була імовірність таких зв’язків, вони не дають права досліднику визнати їх причинно-наслідковими відносинами. Статистика змушена приймати до аналізу дані, на які впливає безліч причин.

Головна вимога до виділення сукупності вивчення – це її якісна однорідність (наприклад, за рівнем інформаційної культури, а не одночасно і за рівнем вихованості та зростом).

Для зведення результатів та проведення статистичної обробки результатів педагогічного дослідження досліднику необ хідні знання про основні поняття математичної статистики. Серед них виділимо такі, як вибіркова сукупність (вибірка), генеральна сукупність, об’єм сукупності, репрезентативна вибірка, випадковий відбір (простий, механічний, відбір на основі випадкових чисел, серійний відбір), типологічний відбір.

Вибіркова сукупність

У переважній більшості випадків дослідник не в змозі охопити у вивченні всю сукупність. Доводиться, хоча це і пов’язано з деякою втратою інформації, взяти для вивчення лише частину сукупності, її називають вибірковою сукупністю або вибіркою. Завдання дослідника полягає в тому, щоб дібрати таку вибірку, що репрезентувала б генеральну сукупність, іншими словами, ознаки елементів сукупності повинні бути представлені у вибірці. Важливо, щоб у вибірці були збережені істотні, з погляду даного дослідження, ознаки сукупності. Тобто вибіркою називається частина генеральної сукупності, визначена за певними правилами, яка підлягає безпосередньому вивченню. Важливим завданням статистики є перенесення результатів, одержаних під час вивчення вибіркової сукупності з певною мірою припущення на генеральну сукупність. Цей процес називається генералізацією.

Чи варто включати в досліджувану сукуп ність дітей того ж віку, які навчаються в колед жах, гімназіях, ліцеях і інших подібних навчальних закладах?

Генеральна сукупність

Важливим у статистиці є поняття сукупності. Генеральна сукупність чи просто сукупність – це множина, всі елементи якої володіють якимись загальними ознаками. Так усі підлітки-шестикласники 12 років (від 11,5 до 12,5) утворять сукупність. Діти того ж віку, але які не навчаються в школі, чи навчаються, але не в шостих класах, не підлягають включенню в цю сукупність. У ході конкретизації проблем свого дослідження педагогу неминуче доведеться позначити границі досліджуваної ним сукупності.

Об’єм сукупності (вибіркової або генеральної) називають кількість об’єктів цієї сукупності.

Генеральна сукупність не має обмежуватися учнями одного міста або району, бо яка науці користь від того, що дані експерименту обмежуються місцевими масштабами?

Наприклад, потрібно вивчити сукупність об’єктів відносно деякої якісної або кількісної ознаки, які характеризують ці об’єкти. Кожен об’єкт, який спостерігають, має декілька ознак. Розглядаючи лише одну ознаку кожного об’єкта, можна припустити, що інші ознаки рівноправні, або що множина об’єктів одно-рідна. Такі множини однорідних об’єктів називають статистичною сукупністю.

Вибірки бувають повторні та безповторні. Повторною називають вибірку, при якій відібраний об’єкт повертається до генеральної сукупності перед відбором іншого об’єкта. Вибірку називають безповторною, якщо взятий об’єкт до генеральної сукупності не повертається. Найчастіше використовують безповторні вибірки.

Репрезентативність вибірки

Вибірку можна ефективно використовувати для вивчення відповідної ознаки генеральної сукупності лише тоді, коли дані вибірки правильно відображають цю ознаку. Коротко ця умова формулюється таким чином – вибірка повинна бути репрезентативною, тобто представницькою.

Згідно із законом великих чисел теорії імовірностей В.В.Барковський стверджує що, вибірка буде репрезентативною лише тоді, коли її здійснюють випадково. У більшості випадків для марематичної статистики найбільш вдалим засобом здійснення випадкового відбору є простий випадковий. Простим випадковим є такий відбір з генеральної сукупності, при якому кожний об’єкт, що витягається, має однакову імовірність потрапити до вибірки. Вибірка, що здійснена за допомогою простого випадкового відбору, називається простою випадковою. При вибірковому обстеженні засобами збирання даних вибірки можуть бути індивідуальні опитування (інтерв’ю), опитування поштою, телефонні інтерв’ю і таке інше.

З метою забезпечення достатньої інформації для статистичної обробки даних, вибірки повинні мати не менше 20-30 варіантів.

Способи організації вибірки. У практичній діяльності використовують різноманітні способи відбору об’єктів із генеральної сукупності. Усі способи відбору можна поділити на два види: вибір, який не потребує розділення генеральної сукупності на частини (простий випадковий безповторний відбір; простий випадковий повторний відбір); вибір, при якому генеральна сукупність розділяється на частини (розшарований випадковий відбір). До цього виду вибору відносять: типовий відбір; механічний відбір; серійний відбір.

Типовим називають відбір, під час якого об’єкти відбирають не з усієї генеральної сукупності, а лише з її типових частин.

Механічним називають відбір, під час якого генеральна сукупність механічно поділяється на стільки частин, скільки має бути об’єктів у вибірці. З кожної частини випадковим чином відбирають один об’єкт.

Серійним називають відбір, під час якого об’єкти із генеральної сукупності відбирають не по одному, а серіями, які і досліджують. Серійний відбір використовують тоді, коли ознака, яку досліджують, мало змінюється в різних серіях.

Людина в своїй пізнавальній і практичній діяльності завжди здійснює оцінку різних об’єктів, предметів чи явищ. Оцінка – це судження про певний феномен, виражене у кіль-кісній чи якісній формі. Якісні оцінки досліджуваних явищ – характеристика якостей об’єктів без їх співвіднесення з числовим рядом. Кількісні оцінки – результат вимірювання, тобто приписування чисел об’єктам відповідно до певних правил.

Щоб визначити вірогідність відмінностей двох методик удаються до розрахунку таких статистичних показників (параметрів): середньої арифметичної величини; середнього квадратичного відхилення; середньої похибки середнього арифметичного; середньої похибки різниці.

Середні (аналітичні) величини

Середні величини характеризують значення ознаки, біля якої концентруються спостереження або, як ще кажуть, центральну тенденцію розподілу.

Середня арифметична величина застосовується у випадках, коли між визначальною властивістю і даною ознакою існує пряма про-порційна залежність (під час поліпшення показників роботи класу поліпшуються також по-казники роботи кожного учня цього класу).

Середньою арифметичною статистичного ряду називають суму добутків усіх варіант на відповідні частоти, поділену на суму частот.

Властивості середньої арифметичної:

– середня арифметична постійної дорівнює власне постійній;

– якщо варіанти збільшити (зменшити) у одне і те саме число разів, то середня арифметична збільшиться (зменшиться) у стільки ж разів;

– якщо варіанти збільшити (зменшити) на одне і те саме число, то середня арифметична збільшиться (зменшиться) на те саме число;

– середня арифметична відхилень варіант від середньої арифметичної дорівнює нулю.

Структурні величини

У статистичному аналізі застосовують структурні вели-чини або порядкові середні.

Медіаною (Ме) статистичного ряду називають значення ознаки, що припадає на середину ранжованого ряду спостережень.

Медіана може визначатися як для порядкових, так і для кількісних ознак.

Модою (Мо) статистичного ряду називають значення ознаки, якій відповідає найбільша частота.

Головною вадою показників середнього є те, що вони не відображають варіації значень ознак, а вказують лише на деяке середнє, навколо якого групуються інші значення ознаки.

Найпростішим показником варіації є статистичний розмах R, що дорівнює різниці між максимальною та міні-мальною варіантами ряду.

R=xmax – xmin

Найбільшу цікавість являють міри варіації (розсіювання) спостережень навколо середніх величин.

Дисперсією s2 статистичного ряду називають середню арифметичну квадратів відхилень варіант від їх середньої арифметичної.

Дисперсію s2 часто називають вибірковою (або емпіричною), на відміну від σ2 – генеральної дисперсії.

Бажано у якості міри варіації мати характеристику, яка була б виражена у тих самих одиницях, що й значення ознаки. Такою характеристикою є середнє квадратичне відхилення s – арифметичне значення кореня квадратного з дисперсії.

Можна також розглянути характеристику, яка не має розмірності – коефіцієнт варіації, який дорівнює відсотковому відношенню середньої квадратичної відхилення до середньої арифметичної.

Якщо значення коефіцієнту варіації досить великі (наприклад, більші 100%), то це свідчить про неоднорідність значень ознаки.

Властивості дисперсії (вони аналогічні до властивостей дисперсії випадкової величини):

1. Дисперсія постійної дорівнює нулю.

2. Якщо всі варіанти збільшити (зменшити) у k разів, то дисперсія збільшиться (зменшиться) у k2 разів.

3. Якщо всі варіанти збільшити (зменшити) на одне і те саме число, то дисперсія не зміниться.

4. Дисперсія дорівнює різниці між середньою арифметичною квадратів варіантів та квадратом середньої арифметичної.

Середня похибка середнього арифметичного

Поняття "похибка" в статистиці означає наскільки середня арифметична величина, одержана на вибірковій сукупності, наприклад, середня арифметична рейтингу студентів груп, охоплених експериментом, відрізняється від істинної середньої арифметичної величини, яка була б одержана на генеральній сукупності за таких самих умов. Наприклад, ми визначили серед-ню арифметичну величину успішності студентів певної групи. Нам потрібно знати, якою мірою ця величина буде характерна, коли дослідити не одну, а декілька груп студентів. Такою характеристикою і є середня похибка середньої арифметичної величини. Середня арифметична в інших аналогічних дослідженнях лежить у межах від М-т до М + т.

Середня похибка різниці

Необхідною умовою організації педагогічного дослідження є проведення експерименту, на основі якого порівнюються дві навчальні методики. Вірогідність дослідження забезпечується визначенням відмінностей запропонованих методик, що підтверджується математичною статистикою. Коли різниця середніх арифметичних величин дорівнює або більша за три корені квадратних із суми їх середніх похибок, то відмінність двох методик є вірогідною.

Розрахунок середньої похибки різниці застосовується у випадках великого числа варіант п, коли в експериментальному дослідженні бере участь значна кількість студентських груп.

Статистична перевірка педагогічної гіпотези

Статистична гіпотеза, яка висунута, може бути правильною або неправильною, зазначає В.В.Барковський, тому виникає необхідність її перевірки. Перевірка гіпотези здійснюється за даними вибірки, тобто статистичними методами. Тому перевірку гіпотези заданими вибірки називають статистичною.

Під час перевірки статистичної гіпотези заданими випадкової вибірки можна зробити хибний висновок. Якщо за висновком буде відкинута правильна гіпотеза – це похибка першого роду. Якщо за висновком буде прийнята не правильна гіпотеза–похибка другого роду.

Імовірність здійснити похибку першого роду позначають α і називають рівнем значущості. Найчастіше рівень значущості приймають рівним 0.05 або 0.01. Якщо прийнято рівень значущості рівним або меншим 0.05, то це означає, що в п’яти випадках із 100 ми ризикуємо одержати похибку першого роду (відкинути правильну гіпотезу).

Перевірку статистичної гіпотези можна здійснити лише з використанням даних вибірки. Для цього слід обрати деяку випадкову статистичну характеристику (вибіркову функцію),точний або наближений розподіл якої відомий, і за допомогою цієї характеристики перевірити основну гіпотезу.

Висунуту гіпотезу, яку треба перевірити, виділяють, як головну і позначають, як правило, H0 (або H), а іншу – як альтернативну (конкуруючу) – позначають H1 (або K). Нульова та конкуруюча гіпотезу являють собою дві можливості вибору, що взаємовиключають одна одну.

Під час порівняння середніх арифметичних експериментальної і контрольної груп важливо визначити, яка середня не лише більша, але і наскільки. Чим менша різниця між ними, тим більш прийнятною виявиться нульова гіпотеза про відсутність статистично достовірних відмінностей.

З метою перевірки статистичної гіпотези використовують спеціально складену випадкову величину (статистику або критерій) розподіл якої відомий, її позначають t, F чи Χ2 залежно від її розподілу (у загальному вигляді позначимо ). Прийняте рішення, щодо нульової гіпотези опирається на статистичний критерій правило, за яким гіпотеза повинна бути прийнята чи відкинута. Статистичний критерій розбиває всю множину можливих значень статистики (критерію) на дві множини, що не перетинаються: критичну область (область відкидання гіпотези) та область припустимих значень (область прийняття гіпотези). Під час перевірки гіпотези намагаються обрати таку критичну область, де потужність критерію буде найбільшою. ~~

Тобто критичну область слід обирати так, щоб ймовірність потрапляння у неї статистики була мінімальною та рівною α, якщо гіпотеза H0 вірна та максимальна у протилежному випадку. Або іншими словами, критична область повинна бути такою, щоб при даному рівні значущості α, потужність критерію була б найбільшою.

Залежно від вигляду конкуруючої гіпотези H1 обирають правосторонню, лівосторонню або двосторонню критичні області. Так можна впевнитися, що при конкуруючій гіпотезі H1: а>a0 слід використовувати правосторонню критичну область, у випадку H1: а<a0 – лівосторонню критичну область, а при конкуруючій гіпотезі H1: а≠a0 – двосторонню критичну область. За таких обставин границі критичних областей при заданому рівні значущості визначаються з відповідних співвідношень: kpΘ

Принцип перевірки статистичної гіпотези не дає логічного доведення її достовірності або недостовірності. Прийняття гіпотези слід розглядати лише як твердження, що не містить протиріч до дослідних даних.

При формуванні критерію відхилення (прийняття) гіпотези H0 необхідно врахувати, що розподіл статистики F (на відміну від нормального або Стьюдента) не є симетричним.

Тому нульова гіпотеза відкидається, якщо (у випадку правосторонньої критичної області), чи якщо (у випадку лівосторонньої критичної області), чи або (у випадку двосторонньої критичній області). У протилежному випадку нульова гіпотеза не відкидається (приймається).

Між теоретичним та емпіричними законами завжди існуватимуть розбіжності (як би добре не був би дібраний закон). Виникає відповідно питання – чи можна пояснити ці розбіжності лише впливом деяких випадкових обставин (пов’язаних з обмеженою кількістю спостережень), чи вони є істотними та пов’язані з тим, що теоретичний закон дібрано погано. Для відповіді на це питання і використовують критерії згоди.

Нехай необхідно перевірити нульову гіпотезу Н0 про те, що дослідна величина Х розподілена за певним законом розподілу. Для перевірки гіпотези Н0 обирають деяку випадкову величину U, що характеризує ступінь розходження теоретичного та емпіричного розподілів, закон розподілу якої при достатньо великих n відомий та практично не залежить від закону розподілу випадкової величини Х.

Якщо відомий закон розподілу U, то можна знайти ймовірність того, що U прийняла значення не менше ніж, фактично спостережуване у досліді u, тобто U≥u. Якщо P(U≥u)=α мала, то це позначає у відповідності до принципу практичної впевненості, що такі, як у досліді, та більші відхилення практично неможливі. У цьому випадку нульову гіпотезу відкидають. Якщо ж ймовірність P(U≥u)=α не мала, то гіпотезі Н0 можна вважати такою, що не містить протиріч до вибіркових даних.

Χ2 – критерій Пірсона. На практиці найчастіше використовують Χ2 – критерій Пірсона. У ньому за міру розходження U береться величина Χ2, що дорівнює сумі квадратів відхилень частостей (статистичних ймовірностей) wi від гіпотетичних рі, що розраховані за розподілом, що передбачається, та взяті з деякими вагами сі.

Схему застосування критерію Χ2 можна звести до наступного:

1. Визначається міра розходження емпіричних та теоретичних частот Χ2.

2. Для обраного рівня значущості α за таблицею Χ2-розподілу знаходять критичне значення Χ2α; k при кількості ступенів волі k=m–r–1.

3. Якщо значення Χ2, що фактично спостерігається більше критичного, тобто Χ2>Χ2α;k, то гіпотеза Н0 відкидається, якщо Χ2≤Χ2α;k, то гіпотеза не містить протиріч до вибіркових даних.

Має Χ2 розподіл лише при n->∞, тому необхідно, щоб у кожному інтервалі була достатня кількість спостережень (хоча б 5). Якщо в якому-небудь інтервалі кількість спостережень менша за 5, має сенс об’єднати сусідні інтервали, щоб в об’єднаних інтервалах частота була не менша з 5.


Последнее изменение: Tuesday, 7 March 2023, 16:37