Головна

Хибна кореляція

  1. B.1. Парна регресія і кореляція
  2. B.2. Множинна регресія і кореляція
  3. D.1. Парна регресія і кореляція
  4. D.2. Множинна регресія і кореляція
  5. Автокорреляция в залишках, її вимір і інтерпретація. Критерій Дарбіна-Уотсона в оцінці якості трендового рівняння регресії.
  6. Автокорреляция в залишках. Критерій Дарбіна-Уотсона
  7. Автокорреляция рівнів часового ряду

Коли величина коефіцієнта кореляції визначається в першу чергу способом підбору варіант в вибірку, а не реальною залежністю між досліджуваними ознаками, то говорять про «помилкової кореляції».

Величина коефіцієнта кореляції залежить від витягнутості еліпса розсіювання: чим більше довжина головної осі еліпса відрізняється від перетину, тим вище значення коефіцієнта. Випадкові поодинокі, а тим більше парні значення можуть різко підвищити показник сили зв'язку ознак. Особливо чутливий коефіцієнт кореляції до нулів, які можуть потрапити в початкову матрицю при перенесенні даних між електронними таблицями.

Явище помилкової кореляції виникає і в тому випадку, коли досліджувані показники мають в сумі постійне значення, наприклад 100%. Розглянемо співвідношення чисельності гризунів і комахоїдних в різних біотопах (табл. 14). Представники і першого, і другого загонів частіше зустрічаються в корінних хвойних лісах, ніж в антропогенних стація, тим більше в агроценозах. Синхронність їх реакції на трансформацію ландшафтів виражається високим коефіцієнтом кореляції їх чисельності r = 0.85.

Таблиця 14

 біотоп  Чисельність (прим. / 100 Конус-діб)  частка, P (%)
   бурозубок  гризунів  загальна  бурозубок  гризунів  загальна
  Nг Nо Nб / Nо Nг / Nо Nо / Nо
 кедровниках  0.46  0.54
 змішаний  0.44  0.56
 Екотон  0.52  0.48
 Сосняк  0.58  0.42
 Березняк  0.47  0.53
 луг  0.53  0.47
r  0.85    -1.00  

Якщо ж оцінити залежність між часткою гризунів (Рг = Nг/ Nо) і часткою бурозубок (Рб = Nб/ Nо) в цих стація (між індексами домінування), вона складе r = -1.00. Справа в тому, що ці показники розраховуються відносно загальної суми, тому частка полівок становить різницю між 1 і часткою бурозубок: Рг = 1Рб. По суті, ми маємо рівняння строго функціональної зворотного регресії (у = 1?1 •х), Якому відповідає, природно, максимальний негативний коефіцієнт кореляції. Вимога незмінності суми двох показників (1 або 100%), прийняте для обчислення відсотків, виявляється причиною постійної зворотній пропорції між цими показниками. Така кореляція повинна бути названа помилковою, тому що характеризує не біологічну залежність показників, а спосіб їх розрахунку. Коли загальну суму утворюють три і більше ознак, помилкова кореляція буде відрізнятися від r = -1, Але від цього не втратить своєї природи математичного артефакту.

При обробці масивів даних з великою кількістю похідних ознак (індекси домінування видів в співтоваристві, морфофизиологические індикатори) неважко припустити ще один вид помилкової кореляції, яка спостерігається між двома ознаками, віднесеними до загальної для них третьої змінної. За необачність коефіцієнти зв'язку між індексами можуть бути сприйняті як оцінка залежності між ознаками. Такі кореляції, несвідомо наведені третім чинником, по суті є помилковими.

Безумовно, змістовну інтерпретацію можна дати як кореляції ознак, так і кореляції індексів, але вони будуть кардинально відрізнятися. Наприклад, серед кількох видів куницевих (від ласки до борсука) коефіцієнт кореляції між довжиною тонкого і товстого відділів кишечника (r = 0.96) відображає прості морфологічні пропорції: у великої тварини кишечник довший, ніж у дрібного. Однак кореляція між індексами цих органів (розмірів, віднесених до довжини тіла особини) характеризує вже відмінності дієти різних видів (r = 0.78): кишечник щодо менше у облігатних хижаків, ніж у полифагов. Однак у великому масиві похідних значень такі відносини між індексами можуть сприйматися як залежності між ознаками, що неминуче призведе до помилкових висновків.

Щоб піти від подібної двозначності, до обробки бажано залучати тільки попередньо вивірені реальні вихідні показники, а не пов'язані методом розрахунку частки, відсотки або індекси.

 



Попередня   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   36   Наступна

Порівняння середніх арифметичних | порівняння часткою | Порівняння показників мінливості | Порівняння вибірок за допомогою непараметричних критеріїв | Критерій U Уилкоксона - Манна - Уїтні | Порівняння двох частотних розподілів. Критерій хі-квадрат | Оцінка впливу фактора | Однофакторний дисперсійний аналіз кількісних ознак | Непараметричний однофакторний дисперсійний аналіз | Двохфакторну дисперсійний аналіз кількісних ознак |

© um.co.ua - учбові матеріали та реферати