Головна

Основи кореляційного аналізу

  1.  I. Якісні методи системного аналізу.
  2.  I. Методологічні основи менеджменту.
  3.  II. Дидактичні основи курсу
  4. " Основи екології та економіка природокористування "як міжгалузева навчальна дисципліна. Предмет і методологія курсу
  5.  А) Критерії аналізу продажів товару
  6.  Алгоритм аналізу родоводу
  7.  Алгоритм кореляційно-регресійного аналізу парної зв'язку

Однією з головних задач кореляційного аналізу є встановлення залежності (зв'язку) між ознаками (частота пульсу, артеріальний тиск, показник аналізу крові) - випадковими величинами. нехай Х и У - Випадкові величини. Залежні один від одного (якщо вона існує) називається кореляційною залежністю.Ця залежність може бути встановлена якісно - за формою кореляційного поля, і кількісно - Шляхом обчислення коефіцієнта кореляції. При встановленні кореляційної залежності експериментально для кожного обстеженого об'єкта отримують відповідні пари значень величин Х и У (Наприклад, зростання і маси тіла людей певної статі і віку):

значення величини Х х1 х2 х3 . . . хn
значення величини У у1 у2 у3 . . . уn

Обсяг вибірки - n. Кожній парі значень (хi, уi) на площині хОу відповідає одна точка. всього буде n точок.

 
 

 Область на графіку у(х), зайнята цими точками, утворює корреляционноеполе. Різні види таких полів показані на рис. 11. Якщо форма кореляційного поля близька до кола (рис. 11б), То зв'язок між ознаками Х и У немає. Якщо ж кореляційне поле витягнуто (рис. 11а, 11в), То кореляційний зв'язок між ознаками Х и У Тобто, вона тим сильніше, чим більше витягнуто кореляційне поле.

За експериментальними даними, для кожного значення ознаки Х можна знайти  . залежність x = f(x) називається емпіричним рівнянням регресії У на Х. Аналогічно можна отримати залежність у = J (у) - рівняння регресії Х на У. Графіки цих функцій називаються лініями регресії. Якщо вони представляють собою прямі, то кореляційний зв'язок між ознаками Х и У називається лінійної і оцінюється за допомогою вибіркового коефіцієнта кореляції r. Він дорівнює:

r = .

значення r по модулю не перевищують 1, але можуть бути як позитивними, так і негативними:

-1 ? r ? 1 або | r | ? 1.

при r = 0 лінійна зв'язок між Х и У Відсутнє; при значеннях | r | до 0,3 - зв'язок слабка; від 0,3 до 0,7 - помірна; від 0,7 до 1 - сильна; якщо | r | »1 - зв'язок повна або, інакше, функціональна - в цьому випадку існує функція
Y = f(X), Жорстко зв'язує значення Y и X.

при r > 0 зв'язок між ознаками Х и У пряма, Тобто зі збільшенням значень однієї ознаки значення іншого теж збільшуються; при r <0 зв'язок зворотна, Тобто зі збільшенням значень однієї ознаки, значення іншого зменшуються.

Приклад 1. Х - зріст, У -маса тіла людей певної статі і віку. При роботі з різними вибірками для цих ознак r »0,9, тобто зв'язок між ознаками сильна і пряма (зі збільшенням росту досить імовірно збільшення маси тіла).

Приклад 2. Х - Охоплення населення щепленнями по різних районах області деякого регіону, У - Показник захворюваності (зазвичай на 10000 чол.). тут
r »- 0,8; зв'язок сильна і зворотна: зі збільшенням охоплення населення щепленнями ймовірність захворювання зменшується.

Якщо вибірка має досить великий обсяг і добре уявляє генеральну сукупність (репрезентативна), то висновок про тісноту залежності між ознаками, отримане за даними вибірки, можна поширити і на генеральну сукупність. Наприклад, для оцінки коефіцієнта кореляції rг нормально розподіленої генеральної сукупності (при n ? 50) можна скористатися формулою.

< rг < .


* Перинатальний період охоплює внутрішньоутробний розвиток плода, починаючи з 28-го тижня вагітності, період пологів і перші 7 діб життя дитини.

* Завдання вирішується із застосуванням формули Байеса

* Завдання вирішується із застосуванням формули Байеса

* Завдання вирішується із застосуванням формули Байеса

* У цьому випадку вважають, що значення деякої випадкової величини Х можуть лежати в інтервалі (- ?; ?), тобто на всій числовій осі.

* Зазвичай випадкові величини позначають великими літерами латинського алфавіту, а їх можливе значення і ймовірності цих значень - малими.

* Наведемо приклад, що пояснює цей факт. Нехай випадкова величина - рівень опадів, що випали за рік. Вона може приймати будь-які значення з деякого інтервалу. Однак, ймовірність того, що в заданий рік цей рівень виявиться точно дорівнює 40 см, фактично дорівнює 0.

** Іноді розглядають інтервал (- ?; + ?)

* У математичній статистиці ранжируваною поруч часто називається послідовність всіх отриманих в експерименті варіант, записаних в порядку зростання.

* Точніше S2 називається "виправлена ??вибіркова дисперсія"

* Іноді замість довірчої ймовірності використовується величина a = 1 - g, яка називається рівнем значущості (див. 1.5, гл. I).

* У медичній і біологічній літературі ця величина іноді позначається буквою m і називається помилкою репрезентативності.

** Див. Додатки в [4, 5, 9] списку літератури.

 У теорії помилок величину |  Загальні вимоги до курсової роботи


 Закон розподілу дискретної випадкової величини |  Закон розподілу неперервної випадкової величини. Щільність розподілу ймовірності |  Основні числові характеристики випадкових величин |  Нормальний закон розподілу випадкових величин |  Елементи математичної статистики |  Статистичний розподіл вибірки |  Графічне представлення статистичних розподілів вибірок |  Методи описової статистики |  Поняття норми для медичних показників |  Елементи теорії помилок (похибок) |

© 2016-2022  um.co.ua - учбові матеріали та реферати