Головна

Залежність між параметрами

  1. D) тріщинуваті - дві системи тріщин з відстанню між тріщинами більше 1,5
  2. II. Типи відносин між членами синтагми
  3. IV. «Принцип загальності» логічних формул і залежність будови знакових форм мислення від його змісту
  4. IX. 14. Міжнародні відносини на початку 1990-х.
  5. IX. Вимовте слова, дотримуючись відмінність між звуками за ступенем відкритості.
  6. PADDING (Відступи) - як би внутрішнє Расcтояние, між кордоном (рамкою) і вмістом блоку.
  7. " Розгубленість "як перехід між зовнішнім і внутрішнім

Компоненти геосистем пов'язані між собою безліччю прямих і зворотних зв'язків. Виявлення цих взаємозв'язків має важливе наукове і практичне значення. Як показник тісноти взаємозв'язку застосовується коефіцієнт парної кореляції r, Що розраховується за виразом: r = cov (x, y) / [?x, ?y]. Тут cov (x, y) - коваріація (другий змішаний момент), ? - середнє квадратичне відхилення.

n

cov (x, y) = 1 / n ? (xi-mx) (Yi-my)

i= 1

mx, my - Середнє арифметичне (оцінки математичних очікувань) змінних X і Y. При практичних розрахунках замість ? використовується його Незміщена Оцінка, тому в наведеній формулі замість 1 / n слід використовувати 1 / (n-1). Якщо поєднати ці два вирази, то:

___

n / n n

r = ? [(xi-mx) (Yi-my)] / v ? (xi-mx)2 ? (yi-my)2

i= 1 i= 1 i= 1

Коефіцієнт парної кореляції являє собою емпіричну заходи лінійної залежності між змінними X і Y. Він може приймати значення від -1 до +1. Якщо коефіцієнт кореляції по модулю дорівнює 1, то залежність є функціональною. Знак «+» вказує на пряму залежність, «-» - на зворотну. Чим ближче модуль r до 0, тим слабкіше лінійна залежність. Залежність може бути сильною, але нелінійної. У цьому випадку значення r може бути близьким до нуля. Близьке до 1 значення абсолютної величини r аж ніяк не є доказом того, що параметри X і Y взаємопов'язані між собою. Вони обидва можуть бути тісно пов'язані з будь-якою третьою параметром. Так, напевно з часів заснування Санкт-Петербурга існує хибна думка, що проходить по Неві ладожский лід викликає похолодання. Насправді ж причиною похолодання є північно-східний вітер, тільки при якому ладожский лід накопичується в Шліссельбурзькій бухті і далі потрапляє в витік Неви. Залежність між параметрами X і Y може бути функціональною або дуже до неї близькою, але величина | r | часто виявляється при цьому близькою до нуля, якщо X є лише одним з багатьох параметрів, що впливають на значення Y. В геоекології лише в окремих випадках можна говорити про незалежні і залежних змінних. Так, інтенсивність сонячної радіації на верхній межі атмосфери є незалежною змінною. В інших випадках ми маємо справу з взаємним впливом параметрів один на одного.

Сильний кореляційний залежність дозволяє за значеннями одних змінних визначати значення інших. Так, для визначення солоності морської води немає необхідності у визначенні концентрацій всіх розчинених у воді речовин, досить лише визначити вміст іонів хлору. При сильній кореляційної зв'язку можна побудувати регресійну залежність між змінними. У ряді випадків це дозволяє по величині відносно просто прогнозованого параметра отримувати значення важко прогнозованого. У практичній діяльності буває, що успішно використовується сильний кореляційний залежність, чіткого пояснення якої немає. Однак якщо не визначена причина залежності, то невідомі просторові і тимчасові рамки можливого застосування цієї залежності.

Рівняння лінійної регресії (y = ax + b) є надійним, якщо виявлена ??залежність величини Y від параметра X пояснює 50% і більше розкиду значень Y щодо оцінки його математичного очікування. Залежність між двома змінними може використовуватися для практичних розрахунків, якщо модуль коефіцієнта парної кореляції більше або дорівнює 0.7. Сенс цієї нерівності визначається значенням квадрата коефіцієнта парної кореляції, так званим коефіцієнтом детермінації. Коефіцієнт детермінації характеризує частку загального розкиду щодо середнього значення (оцінки математичного очікування), пояснюється регресією. Якщо залежність функціональна і точки щодо лінії регресії лежать без розкиду, то весь розкид значень відносно середнього пояснюється виключно регресією, т. Е. R2 = 1. При r = 0.7 коефіцієнт детермінації r2 = 0.49 »0.5. Отже, лише при значеннях r ? 0.7 має сенс використовувати регресійну залежність. В іншому випадку значення параметра Y в більшій мірі залежать від інших параметрів, а не X.

Коефіцієнт детермінації - важливий, але не єдиний показник надійності рівняння регресії. Існує ще ряд статистичних показників, що дозволяють судити про точність отриманого рівняння регресії. Стандартна помилка рівняння лінійної регресії sy(x). Ця величина характеризує середньоквадратичне відхилення точок від прийнятої лінії регресії.

?????????O

/n

sy(x) = O S (yi-f (xi))2 / (N-2)

i= 1

де yi - Спостереження величина, f (xi) - Величина, розрахована за рівнянням регресії, (n-2) - число ступенів свободи, яка дорівнює кількості спостережень мінус число параметрів, що визначаються за емпіричними даними. У разі лінійної регресії таких параметрів 2: коефіцієнт регресії a і вільний член b. Стандартну помилку рівняння лінійної регресії можна також визначити через коефіцієнт кореляції за висловом: ___

sy(x) = sy * O ((1-r2) (N-1)) / (n-2), де sy * - Несмещенная оцінка СКО для ряду Y. Іноді при практичних розрахунках нехтують

___

величиною O (n-1) / (n-2) і використовують більш просту формулу:

___

sy(x) = sy * O1-r2.

Стандартна помилка коефіцієнта парної кореляції (sr):

___

sr = (1-r2) / O n-1

При малій довжині вибірок (n <25) рекомендується вводити в цю формулу поправочний коефіцієнт:

___ ___

sr = [(1-r2) / O n-1] O1 + (11 r2/ 2n) + (75r2-13) / 2n2

Стандартна помилка коефіцієнта регресії sa:

___

/ n _

sa = sy(x) / O S (xi-mx)2

i= 1

Цю формулу можна представити у вигляді:

sy * ___

sa = ?? O (1 r2) / (N -1)

sx *

де sy * І sx * - Незсунені оцінки СКО для рядів X і Y.

Стандартна помилка вільного члена sb:

___

/n n _

sb = sy(x) 'O S (xi)2/ N S (xi-mx)2

i = 1 i = 1

або ???????? ????????

sb = sy * 'O (1 r2) / (N -2) 'O 1+ (mx/ sx *)2

Рівняння регресії можна рекомендувати для практичних розрахунків, якщо виконані наступні умови: n?10; | R | ?0.7; | R | / sr ? 2; | A | / sa ? 2. Бажаним, але не обов'язковим є умова | b | / sb ? 2.

При малих значеннях параметрах b цю вимогу майже ніколи не виконується. Слід враховувати, що справжнє значення y, відповідне аргументу x, буде відрізнятися від значення, отриманого за рівнянням лінійної регресії на деяку величину ei. При цьому передбачається, що ei є нормально розподіленою випадковою величиною з нульовим середнім значенням і середньоквадратичним відхиленням sy(x).

Пропонована система оцінок дозволяє в більшості випадків скласти правильне уявлення про надійність отриманого рівняння регресії і прийняти рішення про можливість його застосування для практичних розрахунків. Однак іноді такого аналізу недостатньо. У разі нерівномірного розподілу емпіричних точок додавання однієї або двох точок може істотно вплинути на параметри рівняння регресії. Основна причина виникаючих труднощів полягає в тому, що точки групуються вкрай нерівномірно. У подібних ситуаціях слід провести розрахунок параметрів рівняння регресії з урахуванням і без урахування «важкої» точки, і, якщо вони істотно розрізняються, рівняння не слід використовувати в якості розрахункового, по крайней мере, до тих пір, поки не з'являться додаткові дані. При цьому додаткові дані можуть як підтвердити, так і спростувати гіпотезу про наявність високої кореляції між X і Y, але в будь-якому випадку рішення буде більш обґрунтованим.

Існують принаймні дві причини, за якими емпіричні точки можуть групуватися дуже нерівномірно: 1) метод найменших квадратів передбачає, що ряди X і Y є вибірками з нормальних сукупностей, що забезпечує приблизно рівну кількість великих і малих значень, але асиметрія вибірок досліджуваних величин може бути досить значною, особливо при невеликих n; 2) геоекологи найчастіше працюють в умовах так званого пасивного експерименту і не можуть на свій розсуд змінювати незалежну змінну. В результаті завжди є ризик отримати нерепрезентативні вибірки, особливо якщо довжина вибірки недостатньо велика.

Коефіцієнт парної кореляції, який визначається за вибірками кінцевої довжини, є випадковою величиною. Якщо значення r не надто велика і довжина вибірки не перевищує 40, то розподіл вибіркових коефіцієнтів кореляції добре апроксимується нормальним законом з середньоквадратичним відхиленням sr. В цьому випадку довірчий інтервал для істинного коефіцієнта кореляції дорівнює: r * - t1asr * ? r 1asr *, Де r * - вибірковий коефіцієнт парної кореляції, t1a - Квантиль стандартного нормального розподілу, відповідний двосторонній рівнем значущості 2a.

P-квантиль називається значення випадкової величини xp, Відповідне заданому значенням ймовірності неперевищення інтегральної функції розподілу F (x) = p. Квантиль - значення випадкової величини, при якому інтегральна функція розподілу F (x) приймає задане значення P.




критерієм Стьюдента | критерій Фішера | Рангове-сумарний критерій Уилкоксона-Манна-Уїтні | Уилкоксона-Манна-Уїтні | Рангові критерій розсіювання Зигеля-Тьюки | Зигеля-Тьюки | ІНТЕРПОЛЯЦІЯ І фільтрація ДАНИХ | лінійна інтерполяція | Сплайновиє інтерполяції | Фільтрація і згладжування |

© 2016-2022  um.co.ua - учбові матеріали та реферати