Головна

III. Перевірка розподілу емпіричних даних на нормальний закон розподілу.

  1.  A) Перший ряд бази даних містить неповторювані імена полів.
  2.  I бігання злочин, пов'язаним Із незаконного обігом 1 сторінка
  3.  I бігання злочин, пов'язаним Із незаконного обігом 2 сторінка
  4.  I бігання злочин, пов'язаним Із незаконного обігом 3 сторінка
  5.  I бігання злочин, пов'язаним Із незаконного обігом 4 сторінка
  6.  I бігання злочин, пов'язаним Із незаконного обігом 5 сторінка
  7.  I бігання злочин, пов'язаним Із незаконного обігом 6 сторінка

Нормальний розподіл випадкової величини зустрічається в природі дуже часто. У зв'язку з цим при відсутності підстав припускати, що випадкова величина розподілена не є нормальним, в першу чергу необхідно перевірити закон розподілу на нормальність. Існують різні способи проведення даної перевірки.

1. побудова "Гістограми".

Для виявлення розподілу ймовірностей одержуваних значень вимірюваної величини, можна побудувати ступінчасту діаграму, яка носить назву "гістограма". Вона будується на безперервних значеннях незалежної змінної, згрупованих в класи рівної ширини.

Сукупність усіх значень випадкової величини, отриманих в результаті експерименту, називається простим статистичним рядом.

Так як простий статистичний ряд виявляється більшим, його перетворять у статистичний ряд. Для цього весь діапазон зміни випадкової величини ділять на кілька рівних інтервалів Dx:

Dx = (xmax - xmin) / K, де Dx -Величина інтервалу, xmax-, Xmin- максимальне, мінімальне (відповідно) значення випадкової величини, k - Число класів, або кількість інтервалів, на які слід розбити весь обсяг вибірки.

Число класів (k) Можна приблизно намітити, користуючись наступною таблицею:

 за формулою Стерджеса:

k = 1 + 3,32lgn

При наявності в сукупності великого числа членів (n> 100) Можна використовувати формулу: k = 5 lgn(К. Брукс, Н. карузерс, 1963)

Розбивку значень по інтервалах проводять за формулами (4):

x1, min= xmin, x2, min= x1, max= x1, min+ Dx, ..., xn, min= xn-1, min+ Dx

x1, max= x1, min+ Dx, x2, max= x2, min+ Dx, ..., xn, max= xn, min+ Dx(4)

Для кожного інтервалу підраховують число mi значень випадкової величини, що потрапили у відповідний інтервал:

xi, minii, max .

Необхідно перевірити, що  ! (Обсяг вибірки),

де jчисло інтервалів.

Після цього обчислюють частоту випадкової величини P  = mi/ n для кожного інтервалу і середнє значення випадкової величини в кожному інтервалі :

 = (Xi,max + xi,min ) / 2 (5)

Необхідно перевірити, що P  = 1 (!)

За статистичному ряду будується "гістограма", для цього по осі абсцис відкладають інтервали (4), що є підставами прямокутників, висота яких дорівнює P  / Dx - Відносної частоті події (Рис.4). Частота появи результатів, відповідних кожному інтервалу, буде пропорційна площі прямокутника.

При великому числі вимірювань і збільшеному в 2 рази числі інтервалів вийде більш згладжена гістограма (Рис.5).

Якщо кількість вимірювань збільшувати, а величину інтервалу зменшувати, то гістограма буде наближатися до плавною кривою, що має форму кривої Гаусса (Рис.5).

Інтервали не можуть дорівнювати нулю, але можуть бути нескінченно малими (dx) І прийняті за точку. Цю криву і слід розглядати як межа, на яку перетворюється гістограма, коли інтервал dx стає нескінченно малим і стягується в точку.

Імовірність появи тих чи інших значень випадкової величини визначається елементарної майданчиком ydx (P  ), званої елементом ймовірності.

При нормальному розподілі середнім арифметичним значенням випадкової величини повинна відповідати максимальна ймовірність (Необхідно перевіряти!).

Значення середньої арифметичної, в цьому випадку, слід знаходити за формулою:

- (Математичне очікування) (6)

Сукупність усіх цих майданчиків, розташованих під кривою Гаусса, є ймовірністю того, що випадкова величина приймає будь-які значення від - ? до + ?, Т. Е. Це ймовірність достовірної події, що дорівнює 1 (формула 3).

У тому випадку, якщо випадкова величина розподілена за нормальним законом, т. Е. Гістограма має вигляд як на Рис.5, для побудови кривої розподілу знаходять значення функції розподілу ймовірностей при x = за формулою:

f (  ) = F (zi) / S (7)

де f ( ) - Щільність ймовірності випадкової величини;

-середнє інтервальне значення випадкової величини;

sсереднє відхилення;

де zi = | -  | / S

f (zi) =

значення функції f (zi ) - Протабулювати (див. Додаток).

2. Перевірка закону розподілу випадкових величин на нормальність за допомогою показників асиметрії та ексцесу.

Показник асиметрії характеризує симетричність розподілу отриманих емпіричних даних певної вибірки. Якщо розподіл симетрично, то показник асиметріїА = 0 (нормальний розподіл). Якщо схил кривої розподілу розташований праворуч від осі симетрії, тоА> 0, Якщо зліва А <0.

Показник ексцесу характеризує вершину кривої розподілу. Для нормального розподілу показник ексцесуЕ = 0. Якщо отримана крива розподілу має гострішу вершину, ніж у нормального розподілу, тоЕ> 0, Якщо вершина більш плоска, ніж у нормального розподілу, то Е <0. Формули для розрахунку А и Е наведені нижче:

А =  (8)

E =  (9)

де A - Показник асиметрії;

E - Показник ексцесу;

n - Обсяг вибірки;

x - Окремі показники даної вибірки;

- середня арифметична вибірки.

Для наближеної перевірки гіпотези про нормальний розподіл необхідно розрахувати середні квадратичні відхилення цих показників (A, E) за формулами:

sА= (10)

и

sЕ=  (11)

деsА, sЕ- Середні квадратичні відхилення показників асиметрії та ексцесу (відповідно);

n - Обсяг вибірки.

Якщо показники асиметрії і ексцесу в два і більше разів перевищує показники їх середніх квадратичних відхилень (т. Е. А> sА і Е> sЕ), Значить гіпотезу про нормальність розподілу даної вибірки слід відкинути.

Аналіз нормальності розподілу по гістограмі (проведений раніше) можна доповнити аналізом перерахованих вище параметрів (A, E, sА, sЕ), Де за xi приймати i - Середнє інтервальне значення, - середнє арифметичне, n - Обсяг вибірки, обчислені раніше.

3. Дослідження ступеня відповідності емпіричних і теоретичних даних на нормальний закон розподілу (за критерієм Колмогорова).

Для порівняння розподілів можна користуватися будь-яким критерієм порівняння (розрахунок параметра l), Який, з одного боку, враховував би розбіжності між ними (параметр G), А з іншого - обсяг статистичного матеріалу (n). Ці критерії звуться критеріїв згоди.

Одним з найбільш вживаних критеріїв є критерій Колмогорова. Використовуючи критерій Колмогорова порівняння потрібно проводити зі стандартним нормальним розподілом F (x, 0, 1):

F (x, ?, ?) =

де ?- Середньоквадратичне відхилення;

?- Математичне сподівання випадкової величини. Для стандартного нормального розподілу ? = 1, ? = 0, Т. Е .:

F (x, 0, 1)=  (12)

Обчислення слід проводити наступним чином. Спочатку всепоказателі, т. Е. Значення випадкової величини  , Отриманих експериментально, мають у своєму розпорядженні в порядку зростання, а під ними записують частоту появи цих ознак m .

Для подальших розрахунків необхідно обчислити середню арифметичну  і суму всіх частот (n), Що дорівнює обсягу вибірки.

На підставі отриманих даних можна розрахувати теоретичні значення випадкових величин за формулою:

х ' = (13)

Крім того, необхідно знайти по теоретичним значенням х ' теоретичні значення функції розподілу, використовуючи таблицю значень стандартної нормальної функції розподілу (12), значення якої протабулювати.

Розрахунок значень функції розподілу емпіричних даних проводять за формулою:

F * (xi) =  або F * (xi) = (14)

де -загальне кількість спостережень, = n (Обсяг вибірки);

kj= -загальна кількість спостережень х  ? хi ;

j = 1,2, ..., n;

j = 1,2, ..., n.

Отримані дані зручно занести в таблицю. Після складання таблиці знаходять необхідний показник 1 по формулі:

1 = G  (15)

де G = мах | F * (х  ) - F (х '  ) |;

n - Обсяг вибірки.

За показником 1 знаходять значення ймовірності р (1) для оцінки міри розбіжності за критерієм Колмогорова:

1) Якщо 1> 0.5, відмінностей за критерієм Колмогорова немає.

2) Якщо 0.1

зауваження: при одному і тому ж n, чим більше G (І, отже, чим більше l), тим менше р (l) того, що розбіжність викликана чисто випадковими причинами. Іноді, для зменшення l (збільшення р (l) - відповідно) буває досить просто збільшити n - обсяг вибірки, і тоді оцінка буде відповідати 1 випадку.

3) Якщо l <0.1, відмінності є, гіпотезу про нормальний розподіл емпіричних даних відкидаємо.

Значення р (l) наведені в таблиці № 1.

Значення ймовірності р (1) для оцінки міри розбіжності за критерієм Колмогорова.

Таблиця № 1.

 l р (l) l  р (l) l  P (l)
 0.0  1.000  0.7  0.711  1.4  0.040
 0.1  1.000  0.8  0.544  1.5  0.022
 0.2  1.000  0.9  0.393  1.6  0.012
 0.3  1.000  1.0  0.270  1.7  0.006
 0.4  0.997  1.1  0.178  1.8  0.003
 0.5  0.964  1.2  0.112  1.9  0.002
 0.6  0.864  1.3  0.068  2.0  0.001

Контрольний приклад:

1.3апісиваем значення виміряної величини в порядку зростання (перший рядок в таблиці № 2 контрольного прикладу), нижче (другий рядок) - число повторень даного значення.

2. обчислюємо значення х ' за формулою (13) (третій рядок значень).

3. обчислюємо значення F * (х) за формулою (14) (четвертий рядок значень).

4. знаходимо значення функції стандартного нормального розподілу (див. Відповідну таблицю) за значенням першого числа х '1 (З 3-го рядка контрольної таблиці).

Він дорівнює - 0.33. Без урахування знака показник буде 0.629. З огляду на, що це число негативне, віднімемо його від 1 і отримаємо 0.371, це значення і заносимо в таблицю в п'ятий рядок. Аналогічним чином поступаємо і з іншими числами. Показники позитивних чисел, певні по таблиці, відразу заносимо в контрольну таблицю. Після складання таблиці знаходимо необхідний показник 1 по формулі (15) і відповідне йому значення р (l) по таблиці 1 і робимо висновок за критерієм Колмогорова. Критерій Колмогорова.

Таблиця № 2.

хi 6 7 11 12  = 9
k 3 4 6 3 ?k = 16 = n i = 1
x ' -0.33 -0.22 0.22 0.33  
F (х ' ) 0.371 0.413 0.587 0.629  
F * (х ) 0.187 0.437 0.812 1  

- Вирахувати G = 0.629 - 1 = 0.371, 1 = 0.371 / 4 = 0.06.

- Відповідну l ймовірність р (0.06) = 1 знаходимо по Табл.№1.

- За критерієм Колмогорова (пункт 1) можна зробити висновок, про те, що відмінностей отриманих емпіричних даних від нормального закону розподілу немає.

 




 Державна бюджетна освітня установа вищої |  Кафедра медичної та біологічної фізики з курсом медичної інформатики |  Коротка теорія |  Схема Уоллера). |  електрокардіографічні відведення |  самописці |  Хід роботи |  I. Проведення статистичної обробки результатів дослідження |  Хід роботи |  ТЕМА: Вивчення будови і роботи апарату для УВЧ-терапії. |

© um.co.ua - учбові матеріали та реферати