Головна

коефіцієнт кореляції

  1. I. Коефіцієнти прибутковості
  2. I. УПРАВЛІННЯ коефіцієнт посилення
  3. III. коефіцієнти ліквідності
  4. IV. коефіцієнти зростання
  5. Абсолютні числа розлучень і загальні коефіцієнти розлучуваності в США і СРСР,
  6. Алгоритм розрахунку коефіцієнта лінійної кореляції Пірсона
  7. Алгоритм розрахунку рангової кореляції Спірмена

У багатьох дослідженнях потрібно вивчити кілька ознак в їх взаємному зв'язку. Якщо вести таке дослідження по відношенню до двох ознаками, то можна помітити, що мінливість однієї ознаки знаходиться в деякому відповідно до мінливості іншого.

У деяких випадках така залежність проявляється настільки сильно, що при зміні першого ознаки на певну величину завжди змінюється і друга ознака на певну величину, тому кожному значенню першої ознаки завжди відповідає цілком певне, єдине значення другої ознаки. Такі зв'язки називаються функціональними.

Зустрічаються функціональні зв'язку в фізичних і математичних узагальненнях. Площа трикутника точно визначається його висотою і підставою, довжина кола - радіусом, швидкість падіння є функція часу падіння і прискорення сили тяжіння, швидкість протікання певної хімічної реакції залежить від температури.

Необхідно врахувати, що функціональні зв'язки зустрічаються тільки в ідеальних умовах, коли передбачається, що ніяких сторонніх впливів немає.

При вивченні живих об'єктів - диких і культурних рослин, тварин, мікроорганізмів - доводиться мати справу зі зв'язками іншого роду. Живий організм розвивається в зв'язку з умовами його життя, під дією нескінченно великого числа факторів, які по-різному визначають розвиток різних ознак.

У живих об'єктів зв'язок між будь-якими двома ознаками настільки часто і сильно порушується і модифікується, що не завжди навіть може бути легко виявлена. У рослин, тварин і мікроорганізмів зв'язок між ознаками зазвичай проявляється особливим чином. Кожному значенню першої ознаки відповідає не одне значення другої ознаки, а ціле розподіл цих значень при цілком певних основних показниках цього приватного розподілу - середньої величини і ступеня різноманітності. Такий зв'язок називається кореляційним зв'язком або просто кореляцією.

Кореляційний зв'язок, наприклад, між вагою тварин та їх довжиною виражається в тому, що кожному значенню довжини відповідає певний розподіл ваги (а не одне значення ваги), і зі збільшенням довжини збільшується і середня вага тварин.

Кореляційний зв'язок не є точною залежністю одного ознаки від іншого, тому вона може мати різну ступінь - від повної незалежності до дуже сильного зв'язку. Крім того, характер зв'язку між різними ознаками може бути різний. Тому виникла необхідність визначати форму, напрямок і ступінь кореляційних зв'язків.

За формою кореляція може бути прямолінійною і криволінійної, у напрямку - прямий і зворотній. Ступінь кореляції вимірюється різними показниками, введеними для встановлення сили зв'язку між кількісними і якісними ознаками. Такими показниками є коефіцієнт кореляції r, кореляційне відношення ?.

Зобразити кореляційний зв'язок двох ознак можна трьома способами:

- За допомогою кореляційного ряду, що складається з ряду пар значень, у тому числі одне відноситься до першого ознакою, а інше в цій парі відноситься до другого ознакою, пов'язаному з першим. На малюнку 11.1 показані схеми кореляційних рядів при п'яти ступенях кореляційної зв'язку.

- За допомогою кореляційної решітки, в якій кожної особини відповідає певна клітина. На малюнку 11.1 показана схема кореляційних решіток для п'яти ступенів кореляційної зв'язку між двома ознаками. Значення першої ознаки нанесені по осі абсцис, значення другого - по осі ординат.

- За допомогою лінії регресії, абсциси якої пропорційні значенням першої ознаки, а ординати - значенням другої ознаки, кореляційно пов'язаного з першим. На малюнку 11.1 показані схеми ліній регресії для п'яти ступенів кореляційної зв'язку між двома ознаками.

       
       
       
       
       
 
X1
X2
 Пряма повна зв'язок; r = +1,0
       
       
       
       
       
 
X1
X2
 Пряма часткова зв'язок; r = +0,8
         
     
       
     
         
 
X1
X2
 Відсутність зв'язку; r = 0
       
       
       
       
       
 
X1
X2
 Зворотній часткова зв'язок; r = - 0,8
       
       
       
       
       
 
X1
X2
 Зворотній повна зв'язок; r = - 1,0

Малюнок 11.1 - Схема прямолінійних кореляційних зв'язків

Коефіцієнт кореляції вимірює ступінь і визначає напрямок прямолінійних зв'язків.

Лінійна залежність між ознаками - це такий зв'язок, при якій рівномірним змін першої ознаки відповідають рівномірні (в середньому) зміни другої ознаки при незначних і безладних відхиленнях від цієї рівномірності. Наприклад, при збільшенні довжини тіла на кожен сантиметр ширина збільшується в середньому на 0,7 см.

При графічному зображенні прямолінійних зв'язків
(Рисунок 11.1) (якщо по осі абсцис відкласти значення першої ознаки, по осі ординат - другого і отримані точки з'єднати) виходить пряма або така крива, середнє якої проходить по прямій.

При зображенні прямолінійних кореляційних зв'язків у формі кореляційних решіток (рисунок 11.1) частоти всередині розташовуються в формі еліпса. Велика вісь цього еліпса проходить або по діагоналі від кута найменших значень (при позитивній кореляційної зв'язку), або по діагоналі від кута, де сходяться найменші значення однієї ознаки і максимальні значення іншого, до протилежного кута (при негативній кореляційної зв'язку).

При вимірюванні ступеня зв'язку між різними ознаками доводиться порівнювати величини, виражені в різних одиницях виміру. Наприклад, при вимірюванні зв'язку між вагою тваринного і його довжиною треба зіставити кілограми ваги з сантиметрами довжини. В інших випадках зміни обсягу зіставляються зі змінами віку, зміни ваги руна в кілограмах зі змінами вмісту в ньому жиропота у відсотках, довжина ніг у сантиметрах зі швидкістю бігу в хвилинах і т. Д.

Проводити такі порівняння виявилося можливим шляхом використання нормованого відхилення, що обчислюється за формулою:

 (11.1)

Нормоване відхилення служить універсальної і неіменованого мірою розвитку ознак. Ці властивості нормованого відхилення і дозволили сконструювати основний показник кореляційної зв'язку - коефіцієнт кореляції.

Основна формула, яка розкриває сутність цього показника, має зовсім просту структуру:

 (11.2)

де r - коефіцієнт кореляції;

- Нормовані відхилення даних по першому і другому ознакою;

n - Число ступенів свободи, рівну в даному випадку числа порівнюваних пар без однієї.

Сума творів нормованих відхилень, що входить в формулу для коефіцієнта кореляції, має наступні трьома особливими властивостями.

Якщо обидві ознаки змінюються паралельно, то сума творів їх нормованих відхилень дає позитивну величину. Якщо при збільшенні однієї ознаки іншого зменшується, то доводиться множити позитивні числа на негативні і вся сума творів нормованих відхилень дає негативну величину. Тому коефіцієнт кореляції може визначати напрямок зв'язку: при прямих зв'язках він позитивний, а при зворотних зв'язках негативний.

При повних зв'язках, коли зміни обох ознак строго відповідають один одному і кореляційний зв'язок перетворюється в функціональну, сума творів нормованих відхилень стає рівною кількістю ступенів свободи:

 (11.3)

Тому максимальне значення коефіцієнта кореляції дорівнює 1 для позитивних або прямих зв'язків:

 (11.4)

для негативних, або зворотних зв'язків:

 (11.5)

При повній відсутності кореляційної зв'язку між ознаками сума творів нормованих відхилень дорівнює нулю, і тому коефіцієнт кореляції в цих випадках теж дорівнює нулю:

 (11.6)

Граничні значення коефіцієнта кореляції (r= + 1,0; r= 0,0;
r= -1,0) На практиці зустрічаються вкрай рідко.

П'ять основних видів прямолінійною кореляційної зв'язку, відповідні коефіцієнтам кореляції +1,0; +0,8; 0,0; -0,8 і
-1,0, Показані на малюнку 11.1.

Основна формула коефіцієнта кореляції добре розкриває сутність цього показника, але для роботи вкрай незручна, особливо при численних групах. Тому розроблені різноманітні робочі формули для практичних розрахунків в різних умовах - для малих і великих груп при малозначних і багатозначних варіантах.

Всі ці формули дають однаковий результат і застосування будь-якої з них обумовлюється тільки зручністю і простотою необхідних обчислень.

У біологічних роботах найбільш прийнятна формула, запропонована для малих груп:

 , (7.6)

де:

X1, X2 - Дані першого і другого ознак;

N - Число порівнюваних пар даних, або число об'єктів, у яких виміряно за дві ознаки;

?1, ?2 - Стандартні відхилення по першому і по другому ознакою.

Застосовується коефіцієнт кореляції в тих випадках, коли необхідно знати напрямок і силу зв'язку між ознаками, причому заздалегідь відомо, що цей зв'язок може вважатися прямолінійною, або коли потрібно з'ясувати ступінь саме прямолінійною зв'язку. При цьому краще проводити два етапи дослідження:

1 розгляд графіка поля регресії;

2 розрахунок коефіцієнта кореляції безпосередньо за даними.

Уже самий вигляд графіка дозволяє встановити напрямок і ступінь прямолінійних зв'язків, а також характер криволінійних зв'язків. При відомому досвіді по виду графіка можна отримати перше уявлення про особливості і силі зв'язку між досліджуваними ознаками.




репрезентативність | Помилки репрезентативності та інші помилки досліджень | довірчі кордону | Загальний порядок оцінки | Оцінка середньої арифметичної | Оцінка середньої різниці | Недостовірна та достовірна оцінка середньої різниці | Оцінка різниці генеральних середніх | Критерій достовірності різниці | Репрезентативність при вивченні якісних ознак |

© um.co.ua - учбові матеріали та реферати