загрузка...
загрузка...
На головну

Перевірка статистичних гіпотез

  1. II. Перевірка і усунення затираний рухомий системи РМ.
  2. V. Самоперевірка
  3. V.ПРОВЕРКА гіпотези Про закон розподілу.
  4. VI. Перевірка довговічності підшипників
  5. VIII. Перевірка довговічності підшипника
  6. VIII. Перевірка довговічності підшипників
  7. X. Перевірка міцності шпонкових з'єднань

12.1. Основні поняття. Перевірка гіпотез про параметри

нормально розподіленої генеральної сукупності.

У багатьох випадках результати спостережень використовуються для перевірки припущень (гіпотез) щодо тих чи інших властивостей розподілу генеральної сукупності.

нехай X - Спостерігається дискретна або безперервна випадкова величина. Статистичної гіпотезою H називається припущення щодо параметрів або виду розподілу випадкової величини X. статистична гіпотеза Н називається простий, Якщо вона однозначно визначає розподіл випадкової величини X; в іншому випадку гіпотеза Н називається складної. Так, простий гіпотезою є припущення про те, що випадкова величина X розподілена за нормальним законом N(n, 0).

якщо ж висловлюється припущення, що випадкова величина X має нормальний розподіл N(m, 1), де а?m?b, То це складна гіпотеза. Прикладом складної гіпотези є також припущення про те, що безперервна випадкова величина X з ймовірністю 1/3 приймає значення з інтервалу (l, 5); в цьому випадку розподіл випадкової величини X може бути будь-яким з класу безперервних розподілів.

Буває, що розподіл випадкової величини X відомо, і за вибіркою спостережень необхідно перевірити припущення про значення параметрів цього розподілу. Такі гіпотези називаються параметричними. Розглянемо перевірку параметричних гіпотез.

Перевіряється гіпотеза називається нульовою гіпотезою і позначається Н0. Поряд з гіпотезою Н0 розглядають одну з альтернативних (конкуруючих) гіпотез Н1. Так, якщо перевіряється гіпотеза про рівність параметра ? деякого заданого значення ?0, Т. Е. Н0: ? = ?0, То в якості альтернативної гіпотези можна розглянути одну з наступних гіпотез: Н1 (1) : ? > ?0; Н1(2): ? < ?0; Н1 (3): ? ? ?0; Н1(4): ? = ?0, де ?1 - Задане значення, ?1 ? ?0. Вибір альтернативної гіпотези визначається конкретної формулюванням завдання.

Правило, за яким приймається рішення прийняти або відхилити гіпотезу Н0, називається критерієм K. Так як рішення приймається на основі вибірки спостережень випадкової величини X, необхідно вибрати відповідну статистику, яка називається в цьому випадку статистикою Z критерію K. При перевірці простий параметричної гіпотези Н0: ? = ?0як статистики критерію вибирають ту ж статистику, що і для оцінки параметра ?, Тобто .

Перевірка статистичної гіпотези грунтується на принципі, відповідно до якого малоймовірні події вважаються неможливими, а події, що мають велику ймовірність, вважаються достовірними. Цей принцип реалізують так: перед аналізом вибірки фіксується деяка мала ймовірність а, звана рівнем значущості; нехай V - безліч значень статистики Z, a  - Таке підмножина, що за умови істинності гіпотези Н0 ймовірність попадання статистики критерію в Vk дорівнює ?, Тобто P [Z I Vk/ H0] = ?.

позначимо zB вибіркове значення статистики Z, обчислене за вибіркою спостережень. Критерій формулюється так: відхилити гіпотезу H0, якщо zk I Vk; прийняти

гіпотезу H0, якщо zBIV \ Vk . Критерій, заснований на використанні заздалегідь заданого рівня значущості, називають критерієм значимості. безліч Vk всіх значень статистики критерію Z, при яких приймається рішення відхилити гіпотезу H0, називається критичною областю; область V \ Vk називається областю прийняття гіпотези H0.

Рівень значущості ? визначає «розмір» критичної області Vk. Положення критичної області на безлічі значень статистики Z залежить від формулювання альтернативної гіпотези Н1. Наприклад, якщо перевіряється гіпотеза Н1: ? = ?0, а альтернативна гіпотеза Н1, Формулюється як Н1: ? > ?0 (? < ?0), То критична область розміщується на правому (лівому) «хвості» розподілу статистики Z, т. Е. Має вигляд нерівності Z> z1-? (Z ?), де z1-? и z? - Квантилі розподілу статистики Z за умови, що вірна гіпотеза H0. У цьому випадку критерій називається одностороннім, відповідно правостороннім і лівостороннім.

Мал. 15.

Якщо альтернативна гіпотеза формулюється як Н1: ? ? ?0, То критична область розміщується на обох «хвостах» розподілу Z, тобто визначається сукупністю нерівностей Z ?/ 2 і Z> z1-? / 2; в цьому випадку критерій називається двостороннім.

На малюнку 15 показано розташування критичної області Vk для різних альтернативних гіпотез. тут fz(Z / H0) -щільність розподілу статистики Z критерію за умови, що вірна гіпотеза H0, V \ Vk- область прийняття гіпотези, P [ZIV \ Vk] = 1-?.

Перевірка параметричної статистичної гіпотези за допомогою критерію значущості складається з наступних етапів:

1) сформулювати перевіряється (H0) І альтернативну (Н1) Гіпотези;

2) призначити рівень значущості ?;

3) вибрати статистику Z критерію для перевірки гіпотези H0;

4) визначити вибіркове розподіл статистики Z за умови, що вірна гіпотеза H0;

5) залежно від формулювання альтернативної гіпотези визначити критичну область Vk одним з нерівностей Z ? і Z> z1-?; або сукупністю нерівностей Z ?/ 2 і Z> z1-? / 2;

6) отримати вибірку спостережень і обчислити вибіркове значення zB статистики критерію;

7) вжити статистичне рішення:

якщо zB I VK , То відхилити гіпотезу Н0 що не узгоджується з результатами спостережень;

якщо zB IV \ VK , то прийняти гіпотезу Н0, Т. Е. Вважати, що гіпотеза Н0 який суперечить результатам спостережень.

Зауваження. Як правило на етапах 4) - 7) використовують статистику, квантилі якої табульовані: статистику з нормальним розподілом N (0,1) , Статистику Стьюдента, статистику або статистику Фішера. Однак інтерпретацію рішення та обчислення ймовірностей помилок, що допускаються при перевірці гіпотез, зручно проводити для статистики, що є безпосередньою оцінкою параметра ?, Т. Е. Статистики .

приклад 50. За паспортними даними автомобільного двигуна витрата палива на 100 км пробігу становить 10 л. В результаті зміни конструкції двигуна очікується, що витрата палива зменшиться. Для перевірки проводяться випробування 25 випадково відібраних автомобілів з модернізованим двигуном, причому вибіркове середнє витрат палива на 100 км пробігу за результатами випробувань склало  = 9,3 л. Передбачається, що вибірка витрат палива отримана з нормально розподіленої генеральної сукупності з середнім т і дисперсією ? 2 = 4 л2 . Використовуючи критерій значущості, перевірити гіпотезу, яка стверджує, що зміна конструкції двигуна не вплинуло на витрату палива.

Рішення. Перевіряється гіпотеза про повну загальну середню (m) Нормально розподіленої генеральної сукупності. Перевірку гіпотези проведемо по етапах:

1) перевіряється гіпотеза Н0: т = 10, альтернативна гіпотеза Н1: т < 10;

2) виберемо рівень значущості ? = 0,05;

3) в якості статистики критерію використовуємо оцінку математичного очікування - вибіркове середнє ;

4) так як вибірка отримана з нормально розподіленої генеральної сукупності, вибіркове середнє також має нормальний розподіл з дисперсією  . За умови, що вірна гіпотеза Н0, математичне очікування цього розподілу дорівнює 10. Нормована статистика критерію  має нормальний розподіл N(0,1).

5) альтернативна гіпотеза Н1: т < 10предполагает зменшення витрат палива, отже, потрібно використовувати односторонній критерій. Критична область визначається нерівністю U <іа. По таблиці додатків П1 знаходимо u0,05= -u0,95= -1,645;

6) вибіркове значення нормованої статистики критерію одно .

7) статистичне рішення: так як вибіркове значення статистки критерію належить критичної області, гіпотеза Н0 відхиляється: слід вважати, що зміна конструкції
 двигуна призвело до зменшення витрати палива.

кордон  критичної області для вихідної статистики X критерію може бути отримана зі співвідношення  , Звідки отримуємо = 9,342, т. Е. Критична область для статистики X визначається нерівністю < 9,342.

12.2. Помилки першого і другого роду

Слід пам'ятати, що статистичне рішення може бути помилковим. При цьому розрізняють помилки першого і другого роду.

Помилкою першого роду називають помилку, яка полягає в тому, що гіпотеза Н0 відхиляється, в той час як вона вірна. Імовірність помилки першого роду дорівнює ймовірності попадання статистики критерію в критичну область за умови, що вірна гіпотеза Н0, Т. Е. Дорівнює рівню значущості ?: P [Z I VK/ Н0] = ?.

У розглянутому вище прикладі 50 ймовірність помилки першого роду дорівнює 0,05.

Помилка другого роду відбувається в тому випадку, якщо гіпотеза Н0 приймається, але в дійсності вірна альтернативна гіпотеза Н1. Імовірність помилки другого роду ? можна обчислити (при простій альтернативній гіпотезі Н1) за формулою ? = P [ZIV \ VK/H1].

приклад 51. В умовах прикладу 50 припускаємо, що поряд з гіпотезою Н0: т = 10 л розглядається альтернативна гіпотеза Н1: т = 9л. Як статистики критерію знову візьмемо вибіркове середнє  . Припустимо, що критична область задана наступним нерівністю  <9,44 л. Знайти ймовірності помилок першого і другого роду для критерію з такою критичною областю.

Рішення. Знайдемо ймовірність помилки першого роду. Статистика  критерію за умови, що вірна гіпотеза Н0: т = 10, має нормальний розподіл  . Використовуючи таблицю додатків (П1), знаходимо

.

Отриманий результат означає, що прийнятий критерій класифікує ~ 8% автомобілів, що мають витрату 10 л на 100 км пробігу, як автомобілі, що мають меншу витрату палива.

За умови, що вірна гіпотеза Н1: т = 9, статистика X має нормальний розподіл  . Імовірність помилки другого роду в цьому випадку дорівнює

.

Мал. 16.

Отже, відповідно до прийнятого критерієм 13,6% автомобілів, що мають витрату палива 9 л на 100 км пробігу, класифікуються як автомобілі, що мають витрату 10 л. Ймовірності помилок першого і другого роду показані у вигляді заштрихованих площ під кривими щільності розподілу статистики критерію на рис. 16.

При заданій ймовірності ? помилки першого роду ймовірність помилки другого роду може бути зменшена шляхом збільшення обсягу вибірки. Якщо при цьому ймовірність помилки другого роду не повинна перевищувати заданого значення ?, то мінімальний обсяг вибірки п можна знайти з рішення системи P [z <= VK/ H0] = ?, P = P [ZIV \ VK/ Н1] ??.

Аналітичне рішення такої системи можливо в найпростіших випадках.

приклад 52. Який мінімальний обсяг вибірки п слід взяти в умовах прикладу 50, щоб при перевірці гіпотези Н0: т = 10 л проти альтернативної гіпотези Н1: т = 9 л помилка першого роду дорівнювала ? = 0,01, а помилка другого роду не перевищувала 0,1? Яка критична область в цьому випадку?

Рішення. Так як в альтернативній гіпотезі Н1 передбачається менше значення параметра т, то критична область VK визначається нерівністю <  . За умовою завдання маємо

,

.

Запишемо систему в такий спосіб:

,

.

виключаючи  , Отримаємо, що n ? 53. Підставляючи найменше значення п в перше рівняння системи, знайдемо кордон критичної області: .

Отже, критична область VK визначається нерівністю < 9,361.

Перевірка статистичних гіпотез з використанням критеріїв значущості може бути проведена на основі довірчих інтервалів. При цьому одностороннього критерієм значимості відповідає односторонній довірчий інтервал, а двосторонньому критерієм значимості - двосторонній довірчий інтервал. гіпотеза Н0 приймається, якщо значення ?0 накривається відповідним довірчим інтервалом; в іншому випадку гіпотеза Н0 відхиляється.

Якщо перевіряється гіпотеза Н0: ?1= ?2, то розглядається довірчий інтервал для різниці ?1- ?2. гіпотеза Н0 приймається, якщо довірчий інтервал для різниці параметрів ?1- ?2 накриває нульове значення. Виняток становить перевірка гіпотези про рівність дисперсій Н0:  так як довірчий інтервал будується для відносини дисперсій, то гіпотеза Н0 в цьому випадку приймається, якщо довірчий інтервал накриває значення, рівне одиниці.

приклад 53. В умовах прикладу 50 перевірити гіпотезу Н0: т = 10 л при альтернативній гіпотезі Н1: т < 10 л на рівні значущості ? = 0,05, використовуючи довірчий інтервал для параметра т.

Рішення. знайдемо кордон т2 лівостороннього довірчого інтервалу (-?,т2) Для параметра т при довірчій ймовірності 1? = 0,95. Використовуючи вибіркове середнє  = 9,3 і начение квантилі u0,95 = 1,645, отримаємо

.

Так як значення т = 10 Нехай не накривається інтервалом (-?; 9,958), то гіпотезу Н0 слід відхилити, що збігається з результатом, отриманим при вирішенні прикладу 50.


12.3. Критерії значимості для перевірки гіпотез

Таблиця 6



Попередня   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   Наступна

Теорема множення ймовірностей n незалежних подій | Формула повної ймовірності | формули Бейеса | повторення випробувань | Основні формули | Випадкові величини: дискретні і безперервні | Основні формули для обчислення числових характеристик | I. Приклади деяких розподілів дискретних випадкових величин | Методи статистичного опису результатів спостережень | Генеральної сукупності за вибіркою |

загрузка...
© um.co.ua - учбові матеріали та реферати