загрузка...
загрузка...
На головну

Дисперсійний аналіз.

  1. GAP-аналіз.
  2. SNW- аналіз.
  3. АВС - аналіз.
  4. Зовнішня і внутрішнє середовище організації. SWOT-аналіз.
  5. Двохфакторну дисперсійний аналіз кількісних ознак
  6. Дж. Фейдимен, Р. Фрейгер. Особистість і особистісний зростання: Настільна книга сучасної американської психоаналітики. Вип. 1. Зигмунд Фрейд і психоаналіз. Сімферополь, 1993 .. С. 63.
  7. Дисперсійний аналіз, його завдання. Проведення однофакторного і двухфакторного дисперсійного аналізу.

Спочатку проаналізуємо дисперсію, він передує F-критерієм. Центральне місце займає розкладання загальної суми квадратів відхилень змінної у від середнього значення  на дві частини.

Загальна сума пояснення непоясненим

квадратів регресію (залишкову)

відхилень регресію

Загальна сума квадратів відхилень у від  викликана впливом безлічі причин. Умовно розділимо їх на дві групи: досліджуваний фактор х і інші фактори.

Якщо фактор не впливає на результат, то лінія регресії на графіку паралельна осі ОХ і  . Тоді вся дисперсія результативної ознаки зумовлена ??впливом інших факторів і загальна сума квадратів відхилень збігається із залишковою. Якщо ж інші чинники не впливають на результат, то у пов'язаний з х функціонально і залишкова сума квадратів дорівнює 0, і сума квадратів відхилень, що пояснює регресією збігається із загальною сумою квадратів.

Оскільки не всі точки поля кореляції лежать на лінії регресії, то завжди має місце їх розкид, як обумовлений впливом фактора х, т. е. регресією у по х, так і викликаний дією інших причин (не можна було пояснити варіація). Придатність ЛР для прогнозу залежить від того, яка частина загальної варіації ознаки у припадає на частку пояснення варіацією. Якщо сума квадратних відхилень, обумовлених регресією, буде більше залишкової суми квадратів, то рівняння регресії статистично значимо і фактор х істотно впливає на у. Це рівнозначно тому, що .

Будь-яка сума квадратних відхилень пов'язана з числом ступенів свободи (  ), Т. Е. з числом свободи незалежного варіювання ознаки. Число ступенів свободи пов'язано з числом одиниць сукупності n і з числом, що визначається за нею константи. Т. о. число ступенів свободи має показати, скільки незалежних х відхилень з n можливих  потрібно для утворення даної суми квадратів. Так, для загальної суми квадратів  потрібно  незалежних відхилень, т. к. за сукупністю з n одиниць після розрахунку середнього рівня вільно варіюється лише  число відхилень.

наприклад,

 , тоді  т. к.  , То вільно варіюються тільки 4 відхилення, а п'яте відхилення може бути визначено, якщо попередні чотири відомі.

При розрахунку пояснене або факторної суми квадратів  використовуються теоретичні (розрахункові) значення результативної ознаки  , Знайдені з рівняння .

У лінійної регресії

 , а

 - Загальна дисперсія ознаки у;

 - Дисперсія ознаки у, обумовлена ??фактором х.

Оскільки при заданому обсязі спостережень за х і у факторная сума квадратів при ЛР залежить тільки від однієї константи (коефіцієнта регресії b), то дана сума квадратів має одну ступінь свободи.

До цього ж висновку можна прийти по іншому.

Звідси випливає, що при заданому наборі змінних у і х розрахункове значення  є в ЛР функцією тільки одного параметра - коефіцієнта регресії, тому факторная сума квадратів відхилень має число ступенів свободи, рівну 1.

Існує рівність між числом ступенів свободи загальної, факторної і залишкової сумами квадратів. Число ступенів свободи залишкової суми квадратів при ЛР становить  . Число ступенів свободи для загальної суми квадратів визначається числом одиниць, і т. К. Ми використовуємо середню обчислену за даними вибірки, то втрачаємо одну ступінь свободи, тобто .

Розділивши кожну змінну суму квадратів на відповідне їй число ступенів свободи, отримаємо середній квадрат відхилень, або дисперсію на 1 ступінь свободи.

; ; .

Визначення дисперсії на одну ступінь свободи призводить дисперсії до порівнянного виду. Зіставляючи факторну і залишкову дисперсії в розрахунку на одну ступінь свободи, отримаємо величину F-критерію.

F-критерій для перевірки нульової гіпотези.

Н0 : .

Якщо н0 справедлива, то фактична і залишкова дисперсії не відрізняються один від одного. для Н0 необхідно спростування, щоб Дфакт перевищувала Дост у кілька разів.

Англійська статистик Снедекора розробив таблицю критичних значень F-критерію - це максимальна величина відносини дисперсій, яка може мати місце при випадковому їх розбіжності для даного рівня ймовірності наявності нульової гіпотези.

Обчислення значення F-відносин визнається достовірним (відмінним від одиниці), якщо воно більше табличного. В цьому випадку Н0 (Відсутність зв'язку) відхиляється і робиться висновок про суттєвості зв'язку з цим: ,  відхиляється.

Якщо ж  , То ймовірність Н0 вище заданого рівня (наприклад 0,05) і вона не може бути відхилена без серйозного ризику зробити неправильний висновок про наявність зв'язку.

Н0 не відхиляється, а рівняння регресії стає незначущим.

Величина F-критерію пов'язана з коефіцієнтом детермінації  . факторну  квадратів відхилень можна уявити як  , (  - Загальна дисперсія y;  - Дисперсія y обумовлена ??фактором x (факторна)), а залишкову суму ( ,  ). тоді .

Оцінка значущості рівняння регресії дається у вигляді таблиці дисперсійного аналізу.

 джерела варіації  Число ступенів свободи  квадратів відхилень  Дисперсія на 1 ступінь свободи Fотн
 Факт.  Табл.
 ОбщаяОб'ясняющаяОстаточная - -  -6,61 -

У лінійної регресії зазвичай оцінюється значимість не тільки рівняння в цілому, але й окремих параметрів. Тому по кожному з параметрів визначається його стандартна помилка: и , .

Стандартна помилка коефіцієнта регресії визначається за формулою: ;

 - Залишкова дисперсія на одну ступінь свободи помилки.

Величина стандартної помилки спільно з t-розподілом Стьюдента при n-2 ступенях свободи застосовується для перевірки суттєвості коефіцієнта регресії і для розрахунку його довірчих інтервалів.

Для оцінки суттєвості коефіцієнта регресії його величина порівнюється зі стандартною помилкою, тобто визначається фактичне значення t-критерію Стьюдента.

 , Який порівнюється з табличним значенням при певному рівні значущості  і числі ступенів свободи .

Якщо фактичне значення більше табличного, то гіпотезу про неістотність коефіцієнтів відкидаємо. Довірчий інтервал для коефіцієнта регресії b визначимо за формулою  гранична помилка (  Межі).

Так як коефіцієнт регресії носить в економетричних дослідженнях чітко економічну інтерпретацію, то довірчі інтервали не повинні містити суперечливих результатів, наприклад,  . Тобто, що справжнє значення коефіцієнта одночасно містить позитивні, негативні величини і навіть 0, чого не може бути.

Стандартна помилка параметра a визначається:

Процедура оцінювання не відрізняється від розглянутої вище для b.

 , Його величина порівнюється з табличним, при .

Для оцінки статистичної значущості коефіцієнтів регресії і кореляції розраховується t-критерій Стьюдента і довірчі інтервали для кожного з показників. Було висунуто гіпотеза Н0 про випадкову природу показників, тобто про незначне відміну їх від нуля. Оцінки значущості коефіцієнтів регресії і кореляції за допомогою t-критерію Стьюдента проводиться шляхом зіставлення їх значень з величиною випадкової помилки (S2 залишкова дисперсія на 1 ступінь свободи,  ).

; ; ;

; ; .

Порівнюємо фактичні і критичні (табл.) Значення і приймаємо або відкидаємо Н0

 , То Н0 відхиляється, і вважається, що и  сформувалися під впливом систем фактора x.

Для розрахунку довірчого інтервалу визначаємо граничну помилку  для кожного показника.

; .

Формули для розрахунку довірчих інтервалів мають вигляд:

Якщо в межі довірчого інтервалу потрапляє нуль, тобто нижня межа негативна, а верхня позитивна, то оцінюваний параметр приймається рівний 0, так як не може одночасно приймати позитивне і негативне значення ступенями свободи.

Значимість лінійного коефіцієнта кореляції перевіряється на основі величини коефіцієнта кореляції mr

.

Фактичне значення t-критерію Стьюдента визначається

 , Дана формула свідчить, що в парній лінійної регресії  , бо  , а також  , отже .

Таким чином, перевірка гіпотез про значущість коефіцієнтів регресії і кореляції рівносильна перевірці гіпотези про суттєвості лінійного рівняння.

якщо  при  . Тобто коефіцієнт а суттєво різниться від нуля - є правильною, а залежність достовірною.

Розглянута формула оцінки коефіцієнта кореляції рекомендується до застосування при великій кількості спостережень і якщо r не близько до +1 або -1. якщо  , То розподіл його оцінок відрізняється від нормального або розподілу Стьюдента, так як величина  обмежена значеннями (-1; +1). Щоб обійти це утруднення Р. Фішером було запропоновано для оцінки суттєвості  ввести допоміжну величину z, пов'язану з  наступним відношенням

 змінюється  , Що відповідає нормальному розподілу. Стандартна помилка величини  визначається  , Де n - число спостережень.

При r = 0,991 .

Z можна взяти в таблиці для відповідного r.

висуваємо H0 - Кореляція відсутня: .

 , Тобто фактичне значення  перевищує його табличне значення на рівні значущості и .

З причини того, що r і z пов'язані між собою наведеними вище ставленням, можна обчислити критичні значення r, що відповідають кожному з значень z. Таблиці критичних значень r розроблені для рівнів значимості 0,05 і 0,01 і відповідного числа ступенів свободи. критичні значення  припускають справедливість нульової гіпотези, тобто  мало відрізняється від нуля. Якщо фактичне значення коефіцієнта за абсолютною величиною перевищує табличне, то дане значення  вважається істотним.

Якщо ж  , То фактичне значення r несуттєво.

 



Попередня   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   Наступна

Властивості вибіркових варіацій (дисперсій) і ковариаций. | властивості залишків | Незміщеність МНК-оцінок | спроможність оцінок | Ефективність (оптимальність) оцінок | Несмещённость. | Ефективність. | Протиріччя між несмещённостью і мінімальною дисперсією. | Вплив збільшення розміру вибірки на точність оцінок. | Спроможність. |

загрузка...
© um.co.ua - учбові матеріали та реферати