На головну

Рангове-бісеріальний коефіцієнт кореляції

  1.  IX. Коефіцієнт згладжування фільтру
  2.  V. Метод кореляції
  3.  Аналіз динаміки коефіцієнта співвідношення між темпами зростання продуктивності праці та її оплатою.
  4.  Аналіз коефіцієнтів ліквідності
  5.  Аналіз коефіцієнтів ліквідності балансу
  6.  Аналіз коефіцієнтів оборотності
  7.  Аналіз коефіцієнтів фінансової стійкості

У тих випадках, коли одна змінна вимірюється в дихотомічної шкалою (змінна X), а інша в рангової шкалою (змінна У), використовується рангове-бісеріальний коефіцієнт кореляції. Ми пам'ятаємо, що змінна X, виміряна в дихотомічної шкалою, приймає тільки два значення (коду) 0 і 1. Особливо підкреслимо: не дивлячись на те що цей коефіцієнт змінюється в діапазоні від -1 до +1, його знак для інтерпретації результатів не має значення. Це ще один виняток із загального правила.

Розрахунок цього коефіцієнта здійснюється за формулою:

 (11.17)

де Х1 - середній ранг по тим елементам змінної Y, яким відповідає код (ознака) 1 в змінної X;

Х0 - середній ранг по тим елементам змінної Y, яким відповідає код (ознака) 0 в змінної X;

N- загальна кількість елементів в змінної X.

Вирішимо наступний приклад з використанням рангове-бісе-риального коефіцієнта кореляції.

Завдання 11.8.Психолог перевіряє гіпотезу про те, чи існують тендерні відмінності в вербальних здібностях.

Рішення. Для вирішення даного завдання 15 підлітків різної статі були проранжовано учителем літератури за ступенем вираженості вербальних здібностей. Отримані дані представимо відразу у вигляді таблиці 11.11:

Таблиця 11.11

 № випробуваного п / п  Підлога  Ранги вербальних здібностей

В даному випадку правильність ранжирування можна не перевіряти, оскільки немає співпадаючих рангів і ранжування проводиться по порядку.

У таблиці 11.11 юнаки позначені кодом 1, а дівчата 0. У нашому випадку юнаків 9 осіб, а дівчат 6.

Перш ніж зробити розрахунок за формулою (11.17), знайдемо необхідні величини тобто середні значення рангів окремо для юнаків і для дівчат.

обчислюємо R3Mnrt> за формулою (11.17):

Перевіримо значущість отриманого коефіцієнта кореляції за допомогою формули (11.9); при k = п-1 15-2 = 13:

Число ступенів свободи в нашому випадку дорівнюватиме k = 13. По таблиці 16 Додатка 1 для k = 13 знаходимо критичні значення критерію Стьюдента, вони дорівнюють відповідно для Р <0,05 tкр= 2,16 і для Р < 0,01 tкр = 3,01. У прийнятій формі

записи це виглядає так:

Будуємо «вісь значущості»:

Результат потрапив в зону значущості. Тому приймається гіпотеза Н1, згідно з якою отриманий рангове-бісеріальний коефіцієнт кореляції значимо відрізняється від нуля. Іншими словами, на даній вибірці підлітків виявлені значущі тендерні відмінності за ступенем вираженості вербальних здібностей.

Для застосування рангове-бісеріальний коефіцієнта кореляції необхідно дотримуватися таких умов:

1. Порівнянні змінні повинні бути виміряні в різних; шкалах: одна X - в дихотомічної шкалою; інша Y - в рангової шкалою.

2. Число варіюють ознак в порівнюваних змінних X і Кдолжно бути однаковим.

3. Для оцінки рівня достовірності рангове-бісеріальний ко

коефіцієнта кореляції слід користуватися формулою (11.9) і таблицею критичних значень для tкритерію Стьюдента I при k = п - 2.

11.9. Кореляційне відношення Пірсона ?

Всі розглянуті вище коефіцієнти кореляції служать для виявлення тільки лінійної залежності між ознаками. Для вимірювання нелінійної залежності К. Пірсон запропонував показник, який він назвав кореляційним відношенням. Нагадаємо, що коефіцієнт кореляції rxy. (Формула 11.1), який був введений Пирсоном, характеризує зв'язок між змінними X і У з точки зору прямої або зворотної пропорційності, іншими словами, що отримується зв'язок між змінними є узгодженою і такий, що зі збільшенням однієї змінної інша (в середньому) або тільки збільшується, або тільки зменшується (в середньому). При цьому в першому випадку виходить позитивний коефіцієнт кореляції, у другому негативний.

Кореляційне відношення описує шукану зв'язок, умовно кажучи, з двох сторін: з боку змінної X по відношенню до К, і з боку змінної Y по відношенню до X. Відповідно до цього кореляційне відношення являє со

бій два показника, що позначаються як hyx и hxy* Вони обчислюються окремо один від одного. Однак вони пов'язані між собою, оскільки при строго лінійної залежності між змінними X и Y має місце рівність hyx = hxy В цьому випадку величини обох показників кореляційного відносини збігаються з величиною коефіцієнта кореляції Пірсона.

Показники кореляційного відносини обчислюються за такими двома формулами:

 (11.18)

 (11.19)

тут х и у загальні, a xy и ух - групові середні арифметичні, fy и fx частоти рядів X и Y. Згідно з цими формулами обидва показники завжди позитивні і розташовуються в інтервалі від 0 до +1.

Підкреслимо, що, як правило, hyx ? hxy. Рівність між цими коефіцієнтами можливо лише при наявності строго лінійного зв'язку між корелюється змінними. Саме тому відмінність між hyx и hxy означатиме наявність не лінійної, а зв'язку більш сложного'тіпа між корелюється ознаками.

Для обчислення кореляційного співвідношення hуx (Yno X) або hxy. (X по Y) необхідно виконати наступні дії:

1) розташувати по порядку вихідні дані по X від мень-

шей величини до більшої, при цьому зберігши значення відповідних величин Y пo відношенню до X;

2) визначити частоти змінної X - позначення /(;

3) підрахувати арифметичні (приватні) середні по змінних

ної Y для відповідної частоти fx - позначення ух;

4) знайти варіанти (неповторювані значення) величини X - позначення хi;

5) розташувати по порядку вихідні дані по Y від мень-

шей величини до більшої, при цьому зберігши значення відповідних величин X по відношенню до Y;

6) визначити частоти змінної Y- позначення fy;

7) підрахувати арифметичні (приватні) середні по змінної X для відповідної частоти fy - позначення xy;

8) знайти варіанти (неповторювані значення) змінної Y- позначення уx ;

9) визначити загальні середні по змінної X и Y позначення x и у ;

10) провести розрахунок за формулами (11.18) і (11.19);

11) визначити рівень значимості отриманих показників кореляційного відносини по таблиці критичних зна-i чений для t-критерію Стьюдента при k = п - 2.

На конкретному прикладі розглянемо, як проводити розрахунок показників кореляційного відносини.

Завдання 11.9.Психолог у 8 підлітків порівнює бали по третьому, математичного, субтесту тесту Векс-лера (змінна X) і оцінки з алгебри (змінна Y). Цікавлять психолога питання можна сформулювати двояко. Перше питання, Пов'язані чи успішність вирішення третього субтеста Векслера з оцінками з алгебри? І другий, Пов'язані чи оцінки з алгебри з успішністю рішення третього субтеста Векслера?

Рішення. Уявімо експериментальні дані в наступному вигляді:

значення X 8 18 18 10 16 10 8 14

Значення Y 2 3 4 5 4 4 3 5

Якщо ми підрахуємо коефіцієнт лінійної кореляції Пірсона за формулою (11.1) то отримаємо величину rxy = 0,244. Цей коефіцієнт незначну і, отже, лінійного зв'язку між змінними Х і Y немає. Потрібно з'ясувати - чи існує між двома вищенаведеними змінними інший тип зв'язку?

Зробимо розрахунок згідно з пунктами 1 - 11.

1. Розставимо по порядку величини X від меншої до найбільшої, зберігаючи їх відповідність з вихідними даними по У:

значення X 8 8 10 10 14 16 18 18

Значення Y 2 3 4 5 5 4 3 4

2. Визначаємо частоти змінної X (Що позначаються як fx) І відповідні їм неповторювані значення змінної X (Що позначаються як х). Частоти обчислюються за правилом, викладеному в розділі 3, розділ 3.2. Згідно з цим правилом, якщо будь-яка змінна величина зустрічається в аналізованому ряду один, два, три і більше число раз, то цієї величини проставляється частота, рівна відповідно одному, двох, трьох і великим значенням. Так, в нашому випадку число 8 зустрічається два рази - отже його частота дорівнює 2, число 10, також два рази, отже його частота також дорівнює 2.

частоти змінної X fx 2 2 1 I 2

Неповторювані значення змінної X х 8 10 14 16 18

Перевіримо правильність підрахунку частот - їх сума повинна дорівнювати числу варіюють величин змінної X.

3. Підраховуємо арифметичні приватні середні для змінної Y по відношенню до змінної X. Для цього однаковим значенням вставимо в відповідність їх середнє арифметичне по До таким чином: у вихідних даних двома значеннями 8 і 8 по X відповідали величини 2 і 3 по Y- отже, одного значення X (Рівному 8) - буде відповідати приватне середнє поY рівне (2 + 3): 2 = 2,5. Значенням 10 по

Відповідність між числами 14 і 5 і 16 і

4 залишається незмінним. Значенням 18 по X ставимо - (3 + 4): 2 = 3,5

Таким чином побудовано новий розподіл, де fx- Частота для змінної X. Розташуємо отримані величини в наступному вигляді:

частоти по X fx 2 + 2 1 I

Значення X без повторів хi 8 10 14 16 18

Приватні середні по Y yx 2,5 4,5 5 4 3,5

4. Розташуємо по зростаючій експериментальні дані по Y:

Значення Y 2 3 3 4 4 4 5 5

Значення X 8 8 18 10 16 18 10 14

5. Підрахуємо відповідні частоти:

частоти змінної Y fy 1 2 3 2

неповторювані значення Y уi 2 3 4 5

Перевірка правильності підрахунку частот:

6. Підрахуємо відповідні приватні середні по X:

Розташуємо отримані величини в наступному вигляді:

Частоти по Y fy+1232

значення Y без повторів уi 2 3 4 5

Приватні середні по X xy 8 13 14,7 12

7. Тепер підрахуємо загальні середні.

 - Загальну середню по X.

- загальну середню по Y.

8. Все готово для розрахунку за формулами (11.18) і (11.19)

підрахуємо тепер

В результаті отримано два нерівних показника кореляційного відносини. Для перевірки їх значимості слід застосувати формулу (11.9) для k = п - 2.

Перевіримо на рівень значимості перший показник.

По таблиці 16 Додатка 1 для k = N - 2 = 8-2 = 6 знаходимо:

Будуємо відповідну «вісь значущості»:

Можна зробити висновок про те, що отриманий показник значущий. Приймається гіпотеза H1.

Підраховуємо рівень значущості другого показника:

Оскільки критичні значення вже знайдені вище, будуємо відповідну «вісь значущості»:

Отже, отриманий показник незначну. Приймається гіпотеза H0.

Таким чином можна зробити висновок про те, що в даному випадку є значимий вплив Y на X, а зворотний вплив X на У незначимо. Отже, рішення шуканої завдання може звучати так: добре знання алгебри впливає на ефективність роботи з третім субтестом Векслера, і, навпаки, успішне вирішення третього субтеста Векслера ніяк не позначається на оволодінні учнями алгеброю.

Зрозуміло, кореляційне відношення Пірсона не дає можливості встановити характер виявленої залежності - вона може бути параболічної, кубічної, логарифмічною і ін. З результатів аналізу ясно тільки одне: зв'язок між змінними Х и Забирає нелінійний характер. Більш точно характер зв'язку можна визначити за допомогою методу регресійного аналізу.

На жаль, в психології метод кореляційного відношення не знайшов широкого поширення. Багато досліджень, що використовують кореляційний аналіз, обмежувалися знаходженням тільки лінійної залежності між змінними, хоча не можна виключити ймовірність того, що реальні зв'язку були нелінійними. Нагадаємо, що в нашому прикладі коефіцієнт кореляції Пірсона, підрахований за формулою (11.1) r = 0,243 виявився незначним. Однак, як це було встановлено за допомогою методу кореляційного відносини, зв'язок, з одного боку, дійсно була незначною, а з іншого, навпаки, високозначімой.

Для застосування кореляційного відносини Пірсона необхідно дотримуватися таких умов:

1. Порівнянні змінні повинні бути виміряні в шкалі інтервалів або відносин.

2. Передбачається, що обидві змінні мають нормальний закон розподілу.

3. Число варіюють ознак в порівнюваних змінних X

и Y має бути однаковим.

4. Для оцінки рівня достовірності кореляційного відносини

Пірсона слід користуватися формулою (11.9) і таблицею критичних значень для t-критерію Стьюдента при k = п - 2.



 Бісеріальний коефіцієнт кореляції |  множинна кореляція

 Глава 10 ВСТУП В ДИСПЕРСІЙНИЙ АНАЛІЗ ANOVA |  Однофакторний дисперсійний аналіз |  Рішення. |  Критерій Лінка і Уоллеса |  критерій неменш |  Поняття кореляційної зв'язку |  Коефіцієнт кореляції Пірсона |  Коефіцієнт кореляції рангів Спірмена |  Випадок однакових (рівних) рангів |  Розрахунок рівнів значимості коефіцієнтів кореляції |

© um.co.ua - учбові матеріали та реферати