Головна

Критерій знаків G

  1.  F - критерій Фішера
  2.  F-критерій Фішера
  3.  I. Аналіз рівнів досліджуваних ознак
  4.  S - критерій тенденцій Джонкіра
  5.  Th (критерій Рімана).
  6.  U критерій Маана-Уїтні
  7.  Агроекологічні вимоги сільськогосподарських культур як вихідний критерій класифікації земель

Нерідко, порівнюючи «на око» результати «до» і «після» будь-якого впливу (наприклад, тренінгу), психолог бачить тенденції повторного вимірювання - більшість показників може збільшуватися або, навпаки, зменшуватися. Найбільш простим шляхом оцінки відмінностей, здавалося б, є підрахунок відсотків у змінах в ту або іншу сторону «до» і «після» і порівняння отриманих відсотків між собою. На основі цього порівняння можна було б прийти до висновку, що якщо спостерігаються відмінності у відсотках, то має місце відмінність і в порівнюваних психологічних характеристиках «до» і «після». Подібний підхід категорично неприйнятний, оскільки для відсотків не можна визначити рівень достовірності в їх відмінностях. Робити якісь висновки з експериментального матеріалу можливо тільки на основі статистичних процедур, спеціально сконструйованих так, що на їх основі можна визначити рівень достовірності відмінностей. Відсотки, взяті самі по собі, не дають можливості робити статистично достовірні висновки. Тому, для того щоб довести ефективність будь-якого впливу, необхідно виявити статистично значущу тенденцію в зміщенні (зрушенні) показників.

Для вирішення подібних статистичних завдань психолог може використовувати цілий ряд критеріїв відмінності. Один з найбільш простих критеріїв відмінності - критерій знаків G, Цей крите-

рий відноситься до непараметрическим і застосовується тільки для пов'язаних (залежних) вибірок. Він дає можливість встановити, наскільки однонаправленно змінюються значення ознаки при повторному вимірі пов'язаної, однорідної вибірки. Критерій знаків застосовується до даних, отриманих в рангової, інтервального і шкалою відносин.

Вирішимо з використанням критерію знаків наступне завдання.

Завдання 6.1.Психолог проводить груповий тренінг. Його завдання - з'ясувати чи буде ефективний даний конкретний варіант тренінгу для зниження рівня тривожності учасників?

Рішення. Для вирішення цього завдання психолог за допомогою тесту Тейлора двічі виявляє рівень тривожності у 14 учасників до і після проведення тренінгу. Результати вимірювання наведемо в таблиці 6.1, включивши в неї стовпець, необхідний для розрахунку за критерієм знаків G.

Таблиця 6.1

 № випробовуваних п / п  Рівень тривожності «до» тренінгу  Рівень тривожності «після» тренінгу  зрушення
 + 4
 -9
 - 1
 -6
 + 5
 + 3
 + 1
 + 1
 + 1
 - 1
 - 7
 + 2
 + 3

У стовпці, позначеному словом «Зрушення», для кожного учасника окремо визначають, наскільки змінився його рівень тривожності після проведення тренінгу. Зрушення - це величина різниці між рівнями тривожності одного і того ж учасника «після» і «до» тренінгу. Але не навпаки! Величини зрушень обов'язково повинні бути дані у відповідному стовпці таблиці з урахуванням знаків.

У критерії знаків за результатами, отриманими в стовпці таблиці, позначеному словом «Зрушення», підраховуються суми нульових, позитивних і негативних зрушень. При викорис-тання критерію знаків необхідно враховувати тільки суму позитивних і негативних зрушень, а суму нульових - відкидати.

Проведемо необхідний підрахунок для нашої задачі:

загальне число (сума) нульових зрушень = 1; загальне число (сума) позитивних зрушень = 8; загальне число (сума) негативних зрушень = 5.

Таким чином, відкинувши нульові зрушення, отримуємо 13 ненульових зрушень. При цьому підрахунок показав, що зрушення мали місце і що більша частина з них позитивна.

Нагадаємо, що критерій знаків G призначений для встановлення того, як змінюються значення ознаки при повторному вимірі зв'язковий вибірки: в бік збільшення або зменшення. Тому, аналізуючи співвідношення позитивних і негативних зрушень в нашій задачі, вирішуємо питання: чи можна стверджувати, що після проведення тренінгу спостерігається достовірний зсув в бік зменшення рівня тривожності учасників?

Для вирішення цього питання необхідно ввести два позначення. Перше - сума зрушень, що вийшла найбільшою зветься типового зсувуі позначається буквою п. Типовий зрушення використовується при роботі з таблицею 1 додатка, в якій наводяться критичні величини 5% і 1% рівнів значущості даного критерію. Друге - сума зрушень, що вийшла найменшою, носить назву - нетипового зсувуі позначається як - Gемп. ця величина (Gемп) розташовується на «осі значущості». У нашому випадку Gемп = 5. В цілому типовий і

нетиповий зрушення розглядаються як додаткові друг

до друга.

Підкреслимо, що в тому випадку, коли величини типового і нетипового зрушень виявляються рівними, критерій знаків

не застосовується.

Оцінка статистичної достовірності відмінностей за критерієм знаків проводиться по таблиці 1 додатка. У ній в стовпці, позначеним літерою п наведені величини типових зрушень, а в стовпчиках, що мають позначення, що відповідає рівнями значущості Р = 0,05 і Р = 0,01, - так звані критичні величини. Умовно їх також можна вважати нетиповими зрушеннями. Вони позначаються як G і з ними порівнюється отримане значення нетипового зсуву Gемп.

Отже, оцінюємо рівень достовірності відмінностей нашої задачі. Для цього необхідно скористатися таблицею 1 додатка. Оскільки в нашому прикладі п - 8, (це число типових зрушень), тому потрібний нам ділянку таблиці 1 додатка виглядає так:

Таблиця 6.2

п Р
 0,05  0,01
8

Більш компактно відповідний рядок таблиці 1 додатка прийнято записувати в такий спосіб:

Цей запис означає, що при рівні значущості в 5%, сума нетипових зрушень не повинна перевищувати 1, а при рівні значущості в 1% - 0. В нашому випадку Gемп= 5, що істотно

більше 1.

Для більшої наочності слід побудувати так звану «вісь значущості», на якій розташовуються як величини критичних зрушень, так і величина Gемп тобто величина нетипового зсуву.

«Вісь значущості» має такий вигляд:

Використання «осі значущості» дозволяє чітко бачити, що Сем п потрапило в зону незначущості, тобто отриманий в експерименті загальний позитивний зсув, який відповідає збільшенню рівня тривожності випробовуваних після проведення тренінгу, статистично недостовірний. Інакше кажучи, даний спосіб впливу не привів до істотних змін в рівні тривожності піддослідних.

Звертаємо увагу читача, що в критерії знаків «вісь значущості» образно кажучи, перевернута. Нуль розташовується не як зазвичай (на числовій осі зліва), а праворуч і збільшення числового ряду йде в протилежну сторону, тобто справа наліво. Останнє пов'язано з тим, що чим більше кількість нетипових зрушень, тим менше ймовірність того, що сумарний зсув виявиться статистично достовірний. Подібні винятки в спрямованості «осі значущості» зустрічатимуться і далі. Такий тип розташування «осі значущості» справедливий для критеріїв Т- Вілкоксона, Макнамари і критерію U Вілкоксона-Манна-Уїтні.

Отриманий вище результат може бути переформульовані також в термінах нульової та альтернативної гіпотез: оскільки переважання типового позитивного напрямку зсуву в даному конкретному експерименті є випадковим, то повинна бути прийнята гіпотеза Н0 про відсутність відмінностей, або про наявність подібності. Повертаючись до психологічної задачі, вкажемо, що, згідно з критерієм знаків, застосований психологом спосіб тренінгу незадовільний, оскільки не дає статистично достовірних змін в стані учасників тренінгу.

Завдання 6.2.Отримавши негативну результат, психолог вніс в спосіб тренінгу відповідні корективи. Він знову висуває гіпотезу: поліпшений спосіб тренінгу дозволяє ефективно знижувати рівень тривожності піддослідних.

Рішення. Для перевірки цього твердження психолог провів аналогічний, експеримент, але вже на більшій вибірці випробовуваних. На це раз він включив до групи 19 осіб. У таблиці 6.3 наводяться результати експерименту:

Таблиця 6.3

 № випробовуваних п / п  Рівень тривожності «до» тренінгу  Рівень тривожності «після» тренінгу  зрушення
 -2
 - 17
 + 1
 -8
 - 11
 -20
9  - 18
 - 3
 -3
 - 12
 -1
 - 2
 -6
 - 14
 - 1
 38 v; + 2

Підраховуємо суми зрушень:

нульових - 3 позитивних - 2 негативних - 14

Таким чином, отримуємо, що більшість зрушень негативні. Тепер саме негативні зрушення будуть «типовими» на відміну від попереднього випадку, коли типовими були позитивні зрушення. У таблиці 1 додатка шукаємо рядок, в якій п = 14. Цей рядок винесена нижче в таблицю 6.4:

Таблиця 6.4

п Р
 0,05  0,01

Оскільки в нашому випадку основний, типовий зсув - негативний, то додатковий, «нетиповий» зрушення буде позитивним і, як випливає з таблиці 6.4, на рівні значущості 5% загальна кількість таких зрушень не повинно перевищувати числа 3, а при рівні значущості 1% - 2. Знову переведемо вищесказане в стандартну форму запису:

У нашому випадку сума позитивних (тобто нетипових) зрушень дорівнює 2. Тобто G - 2. Будуємо «вісь значущості»:

значення Gемп = 2 співпало з критичним значенням зони значущості GKр для 1%. Отже, психолог може стверджувати, що отриманий в результаті експерименту зрушення рівня тривожності статистично значущим на 1% рівні. Іншими словами, в результаті тренінгу тривожність випробовуваних знизилася статистично достовірно.

Переформулюємо отриманий результат в термінах статистичних гіпотез: оскільки переважання типового негативного напрямку зсуву в даному випадку не випадково, то, отже, на I% рівні може бути прийнята гіпотеза Н1 про наявність відмінностей, а гіпотеза Н0 про подібність відхилена.

Для кращого розуміння роботи з критерієм знаків розглянемо останній рядок таблиці 1 додатка. У ній варто число 300, це означає, що для роботи з дуже великими за чисельністю вибірками критерій знаків не призначений. При числі типових зрушень, що дорівнює 300, критичні значення для нетипових зрушень будуть рівні відповідно:

Отже, якщо число нетипових зрушень Gемп при числі типових зрушень рівному 300 не перевищує 135 (Gемп Kр = 135), то на рівні значущості 5% приймається гіпотеза Н, про відмінності; і, аналогічно: якщо Gемп не перевищує 129 (Семп <Скр = 129), то на 1% рівні значущості також приймається гіпотеза Я, про відмінності і на відповідних рівнях відхиляються гіпотези Н() про подібність. Ми пам'ятаємо, що при роботі з критерієм знаків сума нульових зрушень не враховується. Тому загальна величина вибірки в цьому критерії може бути досить великою, але не більшою ніж 300 + 135 = 435 елементів. Нагадаємо ще раз, що в разі рівності числа типових і нетипових зрушень - критерій знаків не застосовують.

У висновку слід зауважити, що критерій знаків є одним з найпростіших за способом обчислення. Традиційно він вважається одним з найменш потужних. Однак можна стверджувати, що якщо критерій знаків показав більш значуща відмінності па 1% рівні, то інші, більш потужні критерії підтвердять

ці відмінності. У той же час, якщо критерій знаків не виявив значущих відмінностей, можливо, що більш потужні критерії, навпаки, така різниця виявлять.

Для застосування критерію G необхідно дотримуватися таких умов:

1. Вимірювання може бути проведено в шкалі порядку, інтервалів і відносин.

2. Вибірка повинна бути однорідною і зв'язковий.

3. Число елементів в порівнюваних вибірках має бути рав »

вим.

4. G критерій знаків може застосовуватися при величині типового зсуву від 5 до 300 (на велику величину не розрахована таблиця достовірності).

5. При великому числі порівнюваних парних значень критерій знаків досить ефективний.

6. У разі рівного розподілу типових і нетипових зрушень критерій знаків непридатний, слід використовувати інші критерії.

6.2.2. Парний критерій Т - Вілкоксона

Для вирішення завдань, в яких здійснюється порівняння двох рядів чисел, крім критерію знаків G психолог може використовувати парний критерій Т- Вілкоксона. Цей критерій є більш потужним, ніж критерій знаків, і застосовується для оцінки відмінностей експериментальних даних, отриманих в двох різних умовах на одній і тій же вибірці випробуваних. Він дозволяє виявити не тільки спрямованість змін, але і їх вираженість, тобто він дозволяє встановити, наскільки зрушення показників в якомусь одному напрямку є більш інтенсивним, ніж в іншому.

Критерій Г заснований на ранжируванні абсолютних величин різниці між двома рядами вибіркових значень в першому і другому експерименті (наприклад «до» і «після» будь-якого впливу). Ранжування абсолютних величин означає, що знаки різниць не враховуються, проте в подальшому поряд з

загальною сумою рангів знаходиться окремо сума рангів як для позитивних, так і для негативних зрушень. Якщо інтенсивність зсуву в одному з напрямку виявляється більшою, то і відповідна сума рангів також виявляється більше. Цей зсув, як і в разі критерію знаків, називається типовим, а протилежний, менший за сумою рангів зрушення -нетіпічним. Як і для критерію знаків ці два зсуву виявляються додатковими один до одного. критерій Т - Вілкоксона базується на величині нетипового зсуву, який називається в подальшому ТЕМП.

Завдання 6.3.Психолог проводить з молодшими школярами корекційну роботу по формуванню навичок уваги, використовуючи для оцінки результатів коректурної проби. Завдання полягає в тому, щоб визначити, чи буде зменшуватися кількість помилок уваги у молодших школярів після спеціальних корекційних вправ?

Рішення. Для вирішення цього завдання психолог у 19 дітей визначає кількість помилок при виконанні коректурної проби до і після корекційних вправ. У таблиці 6.5 наведені відповідні експериментальні дані і додаткові стовпці, необхідні для роботи з парного критерію Т- Вілкоксона.

Таблиця 6.5

 № 1  № 2  № 3  № 4  № 5  № 6  № 7
 № випробовуваних п / п  до  після  Зрушення (значення різниці з урахуванням знака)  Абсолютні величини різниць  Ранги абсолютних величин різниць  Символ нетипового зсуву
 - 2  10,5  
 
 - 1  6,5  
 + 1  6,5 *
 -8  
Продовження таблиці 6.5    
6  - 11      
7      
а  - 20      
9  - 18    
 - 1  6,5    
 + 1  6,5 *  
 - 22    
 - 1  6,5    
 -2  10,5    
 - 6  13,5    
 - 4    
 - 1  6,5    
 + 6  13,5 *  
   
 сума         ТЕМП= 26.5  
                             

Обробка даних за критерієм Т - Вілкоксона здійснюється наступним чином:

1. У четвертий стовпець таблиці 6.5 вносяться величини зрушень з урахуванням знака. Їх обчислюють шляхом вирахування з чисел третього стовпчика відповідних чисел другого стовпчика.

2. У п'ятому стовпці у відповідність кожному значенню зсуву ставлять його абсолютну величину.

3. У шостому стовпці ранжируют абсолютні величини зрушень, представлених в п'ятому стовпці.

4. Підраховують суму рангів. У нашому прикладі вона становить:

12,5 + 6,5 + 6,5 + 15 + 16 + 2 + 18 + 17 + 6,5 + 6,5 + 19 + 6,5 + + 10,5 + 13,5 + 12 + 6,5 + 13,5 + 2 = 190

5. Підраховують суму рангів за формулою (1.1):


6. Перевіряють правильність ранжирування на основі збігу сум рангів отриманих двома способами. У нашому випадку обидві величини збіглися, 190 == 190, отже, ранжування проведено правильно.

7. Будь-яким символом відзначають всі наявні в таблиці нетіпіч-

ні зрушення. У нашому випадку - це три позитивних зрушення.

8. Підсумовують ранги нетипових зрушень. Це і буде шукана величина ТЕМП . У нашому випадку ця сума дорівнює: Т ЕМП = 6,5 + + 13,5 + 6,5 = 26,5.

По таблиці 2 Додатка визначають критичні значення Ткр для п = 19. Підкреслимо, що в даному критерії, на відміну від критерію знаків, пошук критичних величин в таблиці 2 Додатка ведеться за загальною кількістю випробовуваних.

Потрібна нам рядок таблиці Додатка виділена нижче в таблицю 6.6:

Таблиця 6.6

п Р
 0,05  0,01

Оскільки в нашому випадку основний, типовий зсув - негативний, то додатковий, «нетиповий» зрушення буде позитивним і на рівні значущості в 5% сума рангів таких зрушень не повинна перевищувати числа 53, а при рівні значущості в 1% не повинна перевищувати числа 38 . Використовуємо прийняту форму записи, уявімо сказане вище наступним чином:

Аналіз «осі значущості» показує, що отримана величина ТЕМП потрапляє в зону значущості. Можна стверджувати, отже, що зафіксовані в експерименті зміни невипадкові і значимі на 1% рівні. Таким чином, застосування корекційних вправ сприяє підвищенню точності виконання коректурної проби.

Отриманий результат може бути переформульовані в термінах нульової та альтернативної гіпотез: оскільки переважання типового негативного напрямку зсуву в даному конкретному експерименті не є випадковим, то повинна бути прийнята гіпотеза Н1 про наявність відмінностей, а гіпотеза Н0 від-клонів.

Звертаємо увагу читача, що напрям «осі значущості» в цьому критерії, так само як і критерії знаків, має положення нуля справа, на відміну від традиційного - зліва, і збільшення числового ряду йде в протилежну сторону.

Для застосування критерію Т Вілкоксона необхідно дотримуватися таких умов:

1. Вимірювання може бути проведено у всіх шкалах, крім номінальної.

2. Вибірка повинна бути зв'язковою.

3. Число елементів в порівнюваних вибірках має бути рівним.

4. Критерій Т - Вілкоксона може застосовуватися при чисельності вибірки від 5 до 50 (на велику величину не розрахована таблиця достовірності).

6.2.3, критерій Фрідмана

Критерій Фрідмана можна розглядати як поширення критерію Т- Вілкоксона на три і більше вимірів зв'язковий вибірки випробовуваних. Критерій дозволяє встановити рівень статистичної достовірності відмінностей відразу в декількох вимірах (від 3 до 100), але не дає можливості виявити напрямок змін. При наявності відразу декількох вимірювань перевага критерію Фрідмана в порівнянні з

двома попередніми критеріями очевидно, оскільки обидва ці критерію працюють тільки з двома стовпцями чисел. Припустимо, що за допомогою критерію знаків нам потрібно було б порівняти чотири стовпці чисел. Тоді критерій знаків довелося б використовувати шість разів - порівняння першого стовпчика з другим, третім і четвертим, другого - з третім і четвертим і третього з четвертим. Критерій Фрідмана дозволяє виявити наявність значущих відмінностей у вимірах за один раз.

Завдання 6.4. Шести школярам пред'являють тест Поранена. Фіксується час вирішення кожного завдання. З'ясовується питання - чи будуть знайдені статистично значущі відмінності між часом рішення перших трьох завдань тесту?

Рішення. Отже, психолог виміряв час вирішення перших трьох завдань тесту у шести піддослідних.

Результати цих вимірювань наведені в таблиці:

Таблиця 6.7

 № 1  № 2  № 3  № 4
 № випробовуваних п / п  Час рішення першого завдання тесту в сек.  Час рішення другого завдання тесту в сек.  Час рішення третього завдання тесту в сек.

Для знаходження відмінностей можна було б скористатися Двома попередніми критеріями, але тоді потрібно було б порівнювати між собою дані другого стовпця з третьому і четвертим, а також дані третього стовпчика з четвертим, тобто виконати три однотипних операції. Критерій Фрідмана дозволяє відразу порівняти між собою три і більше число стовпців, що дає можливість істотно прискорити процес вирішення.

Застосування критерію Фрідмана вимагає виконання наступних операцій.

1. Ранжування експериментальних даних по рядкахтаблиці 6.7, Зверніть увагу, що в цьому випадку ранжування проводиться не по стовпчиках (вертикально), тобто по одному показнику в групі випробуваних, а по рядках (горизонтально), тобто за всіма показниками для одного випробуваного. Виконуючи цю операцію в нашій задачі, перепишемо ще раз таблицю 6.7, додавши в неї необхідні стовпці для значень рангів.

Таблиця 6.8

 № 1  № 2  № 3  № 4  № 5  № 6  N ° 7
 №іспи-туемихп / п  Времярешеніяпервогозаданіятеста всеки.  Рангівременірешеніяпервогозаданіятеста  Времярешеніявторогозаданіятеста всеки.  Рангівременірешеніявторогозаданіятеста  Времярешеніятретьегозаданіятеста всеки.  Рангівременірешеніятретьегозаданіятеста
2
3
 2,5  2,5
е
 Суммарангов        15,5    10,5

2. Підсумовування отриманих рангів за стовпцями таблиці 6.8.

У стовпці 3 отримана сума рангів дорівнює 10, в стовпці 5 -равная 15,5 і в стовпці 7 - рівна 10,5.

3. Підрахунок загальної суми рангів: 10 + 15,5 + 10,5 = 36.

4. Підрахунок суми рангів за формулою (1.3):


де с - Число стовпців;

п - число рядків або число випробовуваних (що в даному випадку одне і те ж).

5. Перевірка правильності ранжирування. Оскільки значення сум рангів, отриманих двома різними способами збіглися, отже ранжування проведено правильно.


6. Розрахунок емпіричного значення критерію Фрідмана, який здійснюється за такою формулою:

де п - Кількість досліджуваних або рядків з - кількість стовпців R1 - сума рангів i-того стовпця


7. Підставляємо в формулу 6.1 необхідні значення з таблиці 6.8, отримуємо

8. По таблиці 3 Додатка визначаємо величини критичних значень х2 фркр для числа випробовуваних рівному 6. Відповідний блок таблиці3 Додатка представлений в таблиці 6.9:

Таблиця 6.9

n Р
 0,052  0,012
 6,33  8,33

Підкреслимо, що з метою стандартизації пред'явлення табличних значень, критичні значення, взяті з таблиці 3 Додатка дані у вигляді, відповідному раніше використаному варіанту. Слід особливо підкреслити, що таблиці для пошуку критичних значень критерію Фрідмана дуже специфічні і відрізняються від стандартних статичних таблиць. Тут рівні значущості Р - Дані нетрадиційно, і тому кожен раз слід вибирати найбільш близькі значення до 0,05 і 0,01. У нашому випадку ці значення становлять 0,052 і 0,0) 2.

Перекладаючи табличні значення в звичну форму записи, отримуємо:

Таким чином, отримане емпіричне значення критерію Фрідмана потрапило в зону незначущості. Звідси випливає, що статистично значущих відмінностей у часі вирішення перших трьох завдань тесту немає.

Переформулюємо отриманий результат в термінах нульової та альтернативної гіпотез: оскільки між показниками, виміряними в трьох різних умовах, існують лише випадкові відмінності, то приймається нульова гіпотеза Н0, Тобто гіпотеза про подібність, а гіпотеза Н1 відхиляється.

Ще одна специфічна особливість критерію Фрідмана полягає в тому, що в залежності від числа вимірювань (умов), використовуються різні таблиці критичних значень. На це слід особливо звернути увагу, щоб не допустити помилкових статистичних висновків.

Правила використання таблиць для знаходження критичних значень в критерії Фрідмана наведені нижче:

1. При загальній кількості вимірювань рівному 3 і числі випробовуваних від 2 до 9 критичні значення критерію Фрідмана визначаються по таблиці 3 Додатка.

2. При загальній кількості вимірювань рівному 4 і числі випробовуваних від 2 до 4 критичні значення критерію Фрідмана визначаються по таблиці 4 Додатка.

3. При більшій кількості вимірів і випробуваних критичні значення критерію Фрідмана визначаються по таблиці 12



 Рекомендації до вибору критерію відмінностей |  критерій Фрідмана

 Тaх тiт |  Глава 6 СТАТИСТИЧНІ КРИТЕРІЇ ВІДМІННОСТЕЙ |  Параметричні і непараметричні критерії |  критерій Пейджа |  критерій Макнамари |  Критерій U Вілкоксона-Манна-Уїтні |  Перший спосіб розрахунку за критерієм U |  Другий спосіб розрахунку за критерієм U |  Критерій Q Розенбаума |  Н - критерій Круськала-Уолліса |

© um.co.ua - учбові матеріали та реферати