Головна

криволінійна регресія

  1. B.1. Парна регресія і кореляція
  2. B.2. Множинна регресія і кореляція
  3. D.1. Парна регресія і кореляція
  4. D.2. Множинна регресія і кореляція
  5. Коефіцієнт кореляції. регресія
  6. лінійна регресія

У більшості випадків зв'язок біологічних ознак не буває лінійної, вони змінюються або з різною швидкістю, або в різних масштабах. Відповідно на графіку форма такого зв'язку відображається не прямий, а кривою лінією. Прикладами можуть служити геометрична прогресія зростання чисельності популяції в оптимальних умовах, відмінність швидкостей росту різних частин тіла, що визначає аллометріческого характер залежності ознак (лицьовий відділ черепа зростає більш інтенсивно, ніж мозковий). У подібних випадках ефективніше використовувати не рівняння прямої лінії (у = ах + b), А різноманітні рівняння кривих ліній, наприклад, статечної, гіперболічної, експоненційної, параболічної, логістичної і ін.

Оскільки метод найменших квадратів початково орієнтований на лінію (пошук рівняння лінії, найменш віддаленої від усіх емпіричних точок), прямий розрахунок рівнянь кривих в рамках регресійного аналізу неможливий. Натурні дані необхідно попередньо «випрямити», т. Е. Уможливити обчислення лінійного рівняння регресії з тим, щоб потім з нього отримати рівняння криволінійної зв'язку. Загальний порядок регресійного аналізу для криволінійної залежності наступний:

- Перетворення вихідних даних, «випрямляє» залежність,

- Розрахунок коефіцієнтів лінійної регресії перетворених даних,

- Проведення дисперсійного аналізу, оцінка значимості коефіцієнтів регресії,

- Зворотне перетворення коефіцієнтів лінійної регресії для конструювання рівняння криволінійної регресії.

Розглянемо процес пошуку рівняння криволінійної регресії на прикладі вивчення залежності ваги печінки прудкої ящірки від довжини її тіла (рис. 16).

Розраховане за вихідними даними рівняння лінійної регресії має вигляд: у = 107.9х - 404.2. І хоча коефіцієнт регресії достовірний (t = 7.6, ? < 0.05) і коефіцієнт детермінації високий R? = 0.866, це рівняння дуже приблизно описує залежність ознак - для найменших спостережуваних значень довжини тіла воно дає абсурдне (негативне) значення маси печінки (107.9 · 3.4 - 404.2 = -37.3 мг). Лінійна модель не годиться навіть для інтерполяції досліджуваних даних. Набагато успішніше справляється з подібним завданням статечна (аллометріческого) функція у = bxa.

0.765 · x3.07
·x 3.07

Мал. 16. Залежність ваги печінки (M, мг) від довжини тіла (L, мм)

у ящірок

Для обчислення коефіцієнтів цього рівняння скористаємося перетворенням: Y = lgy, X = lgx, B = lgb. Після логарифмування статечне рівняння прийняло лінійний вигляд: lgy = lgb + a· lgx або Y = B + aX. Тепер залишається відшукати коефіцієнти рівняння B и a, Використовуючи алгоритм методу найменших квадратів (табл. 19).

Таблиця 19

х у X = lgx Y = lgy X? Y?  X · Y Y' (Y'-Y) ? y'
 3.4  0.531  1.60  0.282  2.567  0.85  1.517  0.00718
 4.2  0.623  1.69  0.388  2.886  1.06  1.799  0.01009
 5.2  0.716  2.18  0.513  4.735  1.56  2.085  0.00838
 5.8  0.763  2.08  0.583  4.323  1.58  2.23  0.02284
 7.1  0.851  2.38  0.725  5.665  2.03  2.5  0.01442
 7.0  0.845  2.61  0.714  6.827  2.21  2.481  0.01728
 7.4  0.869  2.57  0.756  6.596  2.23  2.556  0.00016
 8.2  0.914  2.69  0.835  7.284  2.47  2.693  0.00004
 8.5  0.929  2.78  0.864  7.758  2.59  2.741  0.00201
?  56.8  7.043  20.6  5.66  48.64  16.6    0.08239  

Далі розрахуємо суми, необхідні проміжні значення і коефіцієнти (розрахунки виконувалися в середовищі Excel):

?Y = ?lgy = 20.6, ?Y? = ? (lgy) ? = 48.64, ?X = ?lgx = 7.043,

?X? = ? (lgx) ? = 5.659, ?XY = ? (lgx· lgy) = 16.577,

MY = ?Y / n = 20.6 / 9 = 2.289, MX = ?X / n = 7.043 / 9 = 0.7826,

CXY = ?XY - (?X) · (?Y) / n = 16.572 - 7.043 · 20.602 / 9 = 0.45542,

CX = ?X? - (?X) ? / n = 5.655 - (7.04) ? / 9 = 0.14816,

CY = ?Y? - (?Y) ? / n = 48.638 - (20.601) ? / 9 = 1.4823,

 = 0.4305,

 = 0.1361,

 = 0.9718,

a = CXY / CX = 0.45541 / 0.14815 = 3.0739,

B = MY - aMX = 2.289 - 3.0739 · 0.7826 = -0.11643.

Лінійне рівняння для перетворених даних має вигляд:

lgy = 3.07 · lgx + lg (-0.116) або Y ' = 3.07 ·X - 0.116.

Це рівняння дає можливість розрахувати теоретичні значення ознаки Y ' (Теоретичні значення логарифмів маси печінки), квадрати відхилень прогнозних значень від реальних: (Y ' ? Y) ?, а також їх суму ? (Y ' ? Y) ? = 0.08239.

Ця величина є залишкова сума квадратів; разом із загальною сумою квадратів Cy = Cзаг. = 1.4823 вона дозволяє сформувати таблицю дисперсійного аналізу (табл. 20): Смод. = Сзаг. ? Состат. = 1.4823 - 0.08239 = 1.39993.

Таблиця 20

 складові дисперсії С   df S? F
 Нахил модельної лінії Среграм. == ? (Y 'i - MY)2  1.399 S2 реграм. = 0.39993 F == 118.9377
 Відхилення варіант від лінії Состат. == ? (yi - Y 'i)2  0.0824 S2остат. = 0.01177 F(0.05,1,7) == 5.6
 Загальна (всього) Сзаг. == ? (yi - MY)2  1.482      

отримане значення F = 118 більше табличного (5.6), отже, дисперсія, обумовлена ??регресією, достовірно більше випадкової, т. Е. Ознака Y дійсно залежить від ознаки X, І лінія регресії адекватна вихідним даним. Коефіцієнт детермінації більше, ніж у лінійної регресії, і становить: R? = Среграм. / Сзаг. = 1.399 / 1.4823 = 0.944.

Помилка коефіцієнта криволінійної регресії дорівнює:

 0.281,

а критерій Стьюдента, який перевіряє гіпотезу Але: a = 0, становить

t = a / ma = 3.0739 / 0.281 = 10.9.

Отримане значення (10.9) більше табличного (t(0.05, 8) = 2.31 для рівня значущості ? = 0.05 і числа ступенів свободи df = n - 2 = 8), коефіцієнт регресії a значимо відрізняється від нуля; залежність ознаки Y від X Тобто, причому дуже тісний. Слід пам'ятати, що при розрахунку помилки коефіцієнта криволінійної регресії використовуються стандартні відхилення для перетворених (у нас - прологаріфмірованних) значень ознак.

На завершення виконаємо зворотне перетворення другого коефіцієнта регресії, вільний член дорівнює:

b = 10B = 10-0.11643 = 0.764839.

Тепер рівняння регресії набуває вигляду статечної залежності:

у ' = 0.765 ·x3.07.

теоретичні значення у', Розраховані за цим рівнянням, набагато ближче до вихідних даних, що добре видно і на графіку (рис. 16), і по більшій величині коефіцієнта детермінації (0.94> 0.87) (читачеві нескладно буде виконати всі обчислення в середовищі Excel за допомогою програми Регресія - як для вихідних, так і для перетворених даних).

Аллометріческого рівняння (у '= 0.8х3) Не тільки краще описує залежність між ознаками в статистичному плані, а й надає їй більш ясний біологічний сенс (маса печінки = 0.8 · довжина тіла3). Як відомо, об'ємні величини (обсяг, маса тіла) пропорційні кубу лінійних промірів (довжина тіла). У свою чергу, вага печінки і вага тіла пов'язані прямий пропорційної залежністю. Так стає зрозумілою спостерігається пряма пропорційність ваги печінки кубу довжини тіла.






Попередня   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   Наступна

Оцінка впливу фактора | Однофакторний дисперсійний аналіз кількісних ознак | Непараметричний однофакторний дисперсійний аналіз | Двохфакторну дисперсійний аналіз кількісних ознак | Оцінка залежності між ознаками | Хибна кореляція | множинна кореляція | приватна кореляція | ранговая кореляція | коефіцієнт контингенции |

© 2016-2022  um.co.ua - учбові матеріали та реферати