На головну

дисперсійний аналіз

  1.  A. Поняття про корреляционном аналізі
  2.  B. Поняття про регресійного аналізу
  3.  C) Аналіз, синтез; індукція, дедукція.
  4.  ETOM-аналіз
  5.  GAP-аналіз
  6.  I I.4.2 Маркетинговий аналіз АТЦ
  7.  I АНАЛІЗ МОВНОЇ СИТУАЦІЇ

Дисперсійний аналіз визначається як статистичний метод, призначений для оцінки вплив різних чинників на результат експерименту, а також для подальшого планування аналогічних експериментів.

Однофакторна дисперсійна модель має вигляд:

 (1) де  - Значення досліджуваної змінної, отриманої на i- тому рівні фактора (i = 1,2, ..., m) з j-м порядковим номером (j = 1,2, ..., n);

Fi - Ефект, обумовлений впливом i-того рівня фактора;

 - Випадкова компонента, або обурення викликане впливом неконтрольованих факторів, тю е. Варіацією змінної всередині окремого рівня.

Під рівнем фактора розуміється деяка його міра або стан, наприклад, кількість внесених добрив, вид плавки металу або номер партії деталей і т. П. Основні передумови дисперсійного аналізу:

1. Математичне сподівання обурення  дорівнює нулю. для будь-яких i, т. е.  (2)

2. Збурення  взаємно незалежні.

3. Дисперсія обурення  (Або змінної  ) Постійна для будь-яких i, j, т. Е.

 (3)

4. Обурення  (Або змінна  ) Має нормальний закон розподілу N (0;  ).

Вплив рівнів фактора може бути як фіксованим, або систематичним (модель I), так і випадковим (модель II).

Нехай, наприклад, необхідно з'ясувати, чи є суттєві відмінності між партіями виробів за певним показником якості, т. Е. Перевірити вплив на якість одного фактора партії виробів. Якщо включити в дослідження всі партії сировини, то вплив рівня такого фактора систематичне (модель I), а отримані висновки застосовні тільки до тих окремих партій, які залучалися для дослідження; якщо ж включити тільки відібрану випадково частина партій, то вплив фактора випадкове (модель II). У багатофакторних комплексах можлива змішана модель III, в якій одні чинники мають випадкові рівні, а інші - фіксовані.

Розглянемо цю задачу докладніше. Нехай є m партій виробів. З кожної партії відібрано відповідно n1, n2, ..., Nm виробів (для простоти вважаємо, що n1= n2= ... = Nm= N). Значення показника якості цих виробів представимо у вигляді матриці спостережень

Необхідно перевірити істотність впливу партій виробів на їх якість.

Якщо вважати, що елементи рядків матриці спостережень - це чисельні значення (реалізації) випадкових величин X1, X2, ..., Xn виражають якість виробів і мають нормальний закон розподілу з математичними очікуваннями відповідно a1, a2, ..., Am і однаковими дисперсіями s2, То дана задача зводиться до перевірки нульової гіпотези H0: a1= a2= ... = Am здійснюваної в дисперсійному аналізі.

Позначимо усереднення по якомусь індексу зірочкою (або точкою) замість індексу, тоді середній показник якості виробів i-й партії, або групова середня для i-го рівня фактора, набуде вигляду:

 , (4)

А загальна середня -  (5)

Розглянемо суму квадратів відхилень спостережень  від загальної середньої :

 (6)

абоQ = Q1+ Q2+ Q3.

останній доданок  , так як  Як сума відхилень значення змінної від її середньої.

Перший доданок можна записати у вигляді:

 (7)

В результаті отримаємо наступне тотожність:

Q = Q1+ Q2, (8)

де  загальна, або повна, сума квадратів відхилень;

 - Сума квадратів відхилень групових середніх від загальної середньої, або межгрупповая (факторна) сума квадратів відхилень.

 - Сума квадратів відхилень спостережень від групових середніх, або внутригрупповая (залишкова) сума квадратів відхилень.

У розкладанні (8) міститься основна ідея дисперсійного аналізу. Якщо поділити обидві частини рівності (8) на число спостережень, то отримаємо правило складання дисперсій. Що стосується аналізованої завданню рівність (8) показує, що загальна варіація показника якості, виміряна сумою Q, складається з двох компонент - Q1 і Q2, Що характеризують мінливість цього показника між партіями Q1 і мінливість «всередині» партій Q2, Що характеризують однакову (за умовою) для всіх партій варіацію під впливом неврахованих факторів.

У дисперсійному аналізі аналізуються не власними суми квадратів відхилень, а так звані середні квадрати, є незміщеними оцінками відповідних дисперсій, які виходять розподілом сум квадратів відхилень на відповідне число ступенів свободи.

Нагадаємо, що число ступенів свободи визначається як загальне число спостережень мінус число пов'язують їх рівнянь. Тому для середнього квадрата s12, Що є несмещенной, оцінкою груповий дисперсії, число ступенів свободи k1= M-1, так як при його розрахунку використовуються т групових середніх, пов'язаних між собою одним рівнянням (5). А для середнього квадрата s22, Що є несмещенной оцінкою внутрішньогрупової дисперсії, число ступенів свободи k2 = Mn-m, бо при її розрахунку використовуються всі mn спостережень, пов'язаних між собою т рівняннями (4). Таким чином,

Знайдемо математичні очікування середніх квадратів s12 і s22, Підставивши в їх формули вираз хij (1) через параметри моделі.

 (бо  з урахуванням властивостей математичного очікування, а

Для моделі I з фіксованими рівнями фактора F (i = 1,2, ..., m) - величини невипадкові, тому

гіпотеза H0 набуде вигляду Hi = F*(I = 1,2, .., m), т. Е. Вплив всіх рівнів фактора одне і те ж. У разі справедливості цієї гіпотези M (  ) = M (  ) = .

Для випадкової моделі II доданок Fi в натуральному вираженні (1) - величина випадкова. Позначаючи її дисперсію

 отримаємо з (9)

 (11)

і, як і в моделі I, M (  ) =  . У разі справедливості нульової гіпотези H0> Яка для моделі II приймає вид  = 0, маємо: M (  ) = M (  ) = .

Отже, в разі однофакторного комплексу як для моделі I, так і моделі II середні квадрати и  є незміщеними і, як можна показати, незалежними оцінками однієї і тієї ж дисперсії .

Отже, перевірка нульової гіпотези H0 звелася до перевірки суттєвості відмінності незміщене вибіркових оцінок и  і дисперсії .

Приклад. Є чотири партії сировини для текстильної промисловості. З кожної партії відібрано по п'ять зразків і проведено випробування на визначення величини розривного навантаження. Результати випробувань наведені в табл. 1.

Таблиця 11.2

 Номер партії  Розривне навантаження (кг / см2)
 1 2 3 4  200 190 230 150  140 150 190  170 210 200 150  145 150 190 170  165 150 200 180

Необхідно з'ясувати, чи істотно вплив різних партій сировини на величину розривного навантаження. Прийняти a = 0,05.

Рішення. Маємо m = 4, n = 5. Знайдемо середні значення розривної навантаження для кожної партії за формулою (4):

= (200 + 140 + 170 + 145 + 165) / 5 = 164 (кг / см2)

і аналогічно

= 170, = 2О2 і = 164 (кг / см2).

Середнє значення розривної навантаження всіх відібраних зразків за формулою (5):

 = (200 + 140 + ... + 170 + 180) / 20 = 175 (кг / см2)

(Або, інакше, через групові середні,

 = (164 + 170 + 202 + 164) / 4 = 175 (кг / см2)).

Обчислимо суми квадратів відхилень за формулами (6), (7):

Відповідне число ступенів свободи для цих сум m-1 = 3; mn-n= 5 - 4-4 = 16; nm-1 = 5 - 4-1 = 19.

Результати розрахунку зведемо в табл. 2.

табл. 2.

 компоненти дисперсії  суми квадратів  Число ступенів свободи  Середні квадрати
 Межгрупповая Внутригрупповая Загальна  7270 12250  1660,0454,4

Фактично спостерігається значення статистики  За таблицями додатків критичне значення F-критерію Фішера-Снедекора на рівні значущості a = 0,05 при k1= 16 ступенях свободи F0,05; 3; 16= 3,24. Так як F> F0,05; 3; 16, То нульова гіпотеза відкидається, т. Е. На рівні значущості a = 0,05 (з надійністю 0,95) відмінність між партіями сировини істотно впливає на величину розривного навантаження.

5.4 Багатомірний статистичний аналіз

Багатовимірний статистичний аналіз визначається як розділ математичної статистики, присвячений математичним методам побудови оптимальних планів збору, систематизації і обробки багатовимірних статистичних даних, спрямованих на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного ознаками призначених для отримання наукових і практичних висновків.

Багатовимірні статистичні методи серед безлічі можливих ймовірносно-статистичних моделей дозволяють обґрунтовано вибрати ту, яка найкраще відповідає вихідним статистичним даним, що характеризує реальну поведінку досліджуваної сукупності об'єктів, оцінити надійність і точність висновків, зроблених на підставі обмеженого статистичного матеріалу.

 



 Метод найменших квадратів |  Множинна лінійна, регресія

 Довірчий інтервал для мат. очікування |  Розрахунок довірчих інтервалів. |  Статистичний критерій, статистична область |  Порівняння мат. очікувань |  Перевірка гіпотези про рівність середніх при відомих дисперсіях |  Перевірка гіпотези про рівність середніх при невідомих дисперсіях |  критерій Пірсона |  Правила перевірки |  Вибіркове кореляційне відношення |  Найпростіші випадки криволінійної кореляції |

© um.co.ua - учбові матеріали та реферати