На головну

Перевірка статистичних гіпотез

  1. IV. Закріплення і первинна перевірка засвоєння нових знань
  2. Аналіз частки ринку статистичних агентств РФ в 2006 році
  3. Аналіз частки ринку статистичних агентств РФ в 2008 році
  4. Апаратура АЛС (підсилювач, дешифратор), перевірка пильності і контроль швидкості.
  5. Б) Перевірка нульової гіпотези в разі, якщо обсяг хоча б однієї з вибірок перевершує 25.
  6. Борисова Е. А. Перевірка судових актів у цивільних справах. М., 2005.
  7. В якому випадку проводиться позачергова перевірка знань?

статистична гіпотеза - Це будь-яке припущення про вид або про значення параметрів імовірнісного розподілу.

При перевірці статистичних гіпотез ту гіпотезу, яку перевіряють, прийнято називати нульовий гіпотезою і позначати Hо. одночасно розглядають альтернативну (конкуруючу) гіпотезу Н1. гіпотези Hо і Н1повинні бути протилежні одна одній.

Принцип перевірки статистичних гіпотез полягає в наступному. На основі вибірки даних розраховують якийсь показник Q, який називають статистикою критерію. Цей показник є випадковою величиною (оскільки він розраховується за вибіркою), але його вибирають таким чином, що його імовірнісний розподіл відомо (можливо, наближено). Крім того, значення Q має бути пов'язано з тим, виконується чи ні перевіряється гіпотеза. Всі можливі значення Q розбивають на дві непересічні області - область прийняття гіпотези и критичну область (В якій гіпотеза відхиляється). Наприклад, вибирають критичне значення статистики критерію Qкр таке, що якщо гіпотеза вірна, то ймовірність ? перевищити це значення ? = Р (Q> Qкр) Дуже мала (? = Р (Q> Qкр)). Тоді при Q ? Qкр гіпотеза приймається, а при всіх інших значеннях Q відхиляється Hо.

Правило перевірки статистичної гіпотези називають статистичними критерієм.

Однак, з імовірністю ? може бути все ж допущена помилка (т. Е гіпотеза Hо буде відкинута, хоча насправді вона правильна). Це може статися тому, що значення статистики потрапило в критичну область випадково. Таку помилку називають помилкою першого роду, А відповідну ймовірність називають рівнем значущості критерію. Вона повинна бути невеликою.

Крім того, може бути допущена також помилка другого родуb: вона полягає в тому, що гіпотеза Hо приймається, хоча насправді вона є невірною (а вірна альтернативна гіпотеза H1). Відзначимо, що під час перевірки однієї і тієї ж гіпотези за вибіркою одного і того ж обсягу неможливо одночасно зменшити ймовірність помилок першого і другого роду. Це пов'язано з тим, що з ростом критичної області одночасно зростають і ?, і b. Адже чим більше критична область, тим більша ймовірність відхилити гіпотезу і менше ймовірність її прийняти (відповідно, більша ймовірність відхилити вірну або прийняти невірну). Імовірність НЕ допустити помилку другого роду називається потужністю критерію (Вона дорівнює 1 - b).

Одночасно збільшити потужність критерію і зменшити рівень значимості можна тільки за рахунок збільшення обсягу вибірки, тому що тільки за цієї умови вибіркові значення показників будуть більш точно відображати дійсні характеристики розподілу, а ймовірність випадкових відхилень зменшиться.

Наприклад, на склад надійшла партія виробів. З неї відбирають частину виробів для перевірки на шлюб. За результатами перевірки буде прийнята або відкинута нульова гіпотеза, яка полягає в наступному: частка бракованих виробів в партії невелика, і партію можна прийняти. Припустимо спочатку, що в обраних виробах частка бракованих була велика, і за результатами вибіркового контролю всю партію забракували. Однак, є ймовірність, що перевіряючому випадково попалися саме погані вироби, і насправді партію треба було прийняти, тому що інші вироби не містять шлюбу. В цьому випадку була допущена помилка першого роду, т. Е відхилили вірну нульову гіпотезу (відкинули хороші вироби). Тепер припустимо, що в обраних виробах частка бракованих була невелика, і за результатами вибіркового контролю партію прийняли. Однак, є ймовірність, що перевіряючому випадково попалися саме хороші вироби, і насправді партію треба було забракувати. В цьому випадку була допущена помилка другого роду, т. Е прийнята невірна нульова гіпотеза. З наведених прикладів видно, що чим більше виробів буде вибрано для перевірки, тим менше ризик зробити і ту, і іншу помилку. При рівному обсязі вибірки чим суворіше критерії перевірки (більше критична область), тим більша ймовірність припуститися помилки першого роду і менше - другого (і навпаки).

У юріспуденціі під нульовий гіпотезою зазвичай мається на увазі гіпотеза про те, що підсудний не винен. Відповідно, помилка першого роду - це звинувачення невинного, а помилка другого роду - це виправдання винного. Завдання низького рівня значущості означає, що ймовірність помилки першого роду повинна бути маленькою, т. Е ризик прийняти невірне, «звинуватити невинного» повинен бути маленьким.

Залежно від виду критичної області все статистичні критерії прийнято ділити на три основні класи. Розглянемо їх на прикладі, в якому статистика Q має стандартний нормальний розподіл (т. Е
 Q = N (0; 1)) і заданий п'ятивідсотковий рівень значущості (? = 0,05):

1) правобічна критична область задається нерівністю

Q> Qкр

Якщо ? = 0,05, то площа під графіком щільності стандартного нормального розподілу праворуч від прямої х = Qкр повинна становити 0,05. Вся площа під цим графіком праворуч від вертикальної осі становить 0,5. Щоб знайти значення Qкр, Скористаємося функцією Лапласа, яка повинна тут прийняти значення 0,5 - 0,05 = 0,45. Таке значення відповідає
Qкр = 1,64.

 Малюнок 20 - правостороння критична область

На малюнку 20 площа заштрихованої фігури становить 0,05, т. Е 5% від одиниці (від загальної площі графіка під функцією щільності ймовірності). Це означає, що Р (Q> Qкр) = ? = 0,05. З такою ймовірністю перевіряється гіпотеза буде все-таки відкинута, навіть якщо вона насправді вірна. Якщо фактичне значення статистики критерію Q ? Qкр, Гіпотеза приймається.

2) левосторонняя критична область задається нерівністю

Q кр

Таке значення відповідає Qкр = -1,64. На малюнку 21 площа заштрихованої фігури також становить 0,05, т. Е Р (Q кр) = ? = 0,05. Якщо фактичне значення статистики критерію Q ? Qкр, Гіпотеза приймається.

 Малюнок 21 - Лівобічна критична область

3) двостороння критична область задається нерівностями

Оскільки площа під графіком щільності розподілу в критичній області повинна складати 0,05, площа кожного з двох заштрихованих ділянок на малюнку 22 повинна становити 0,025 (т. Е ? / 2). Тоді функція Лапласа при х = QКР2 повинна прийняти значення 0,5 - 0,025 = 0,475. Таке значення відповідає QКР2 = 1,96. Відповідно, QКР1 = -1,96.

Отже, при використанні двостороннього критерію Р (Q КР1) =
 = Р (Q> QКР2) = ? / 2. якщо QКР1 ? Q ? QКР2, Гіпотеза приймається.

 Малюнок 22 - Двостороння критична область

Розглянемо наступний приклад. Машина для розфасовки спецій при поставці була відрегульована так, щоб середня маса спецій в пакетику в пробної партії з 50 штук становила 0 = 90 (г) при СКО sх = 10 (г). З розфасованої через місяць партії було відібрано 60 пакетиків, і середня маса спецій в пакетику склала 0 = 86 (г) при СКО sy = 8,5 (г). Необхідно з'ясувати, чи є це випадковим збігом, або регулювання машини порушена.

Сформулюємо нульову гіпотезу: регулювання не порушена. Це означає, що насправді середні величини при постачанні і зараз рівні, т. Е М ( -  ) = М (  ) - М (  ) = 0. Будемо вважати, що випадкова величина -  має нормальний розподіл з математичним очікуванням 0.

Знайдемо СКО цієї випадкової величини.

Яка дисперсія випадкової величини  ? D (  ) = D ((Sxi) / N)) =
 = (D (Sxi)) / N2 = (SD (xi)) / N2 = s2х* N / n2 = s2х/ N, де n = 50, т. Е D (  ) = 100/50 = 2.

Аналогічно D (  ) = S2y/ N, де n = 60, т. Е D (  ) = 8,52/ 60 = 72,25 / 60 »1,2.

Тоді D ( -  ) = D (  ) + D (  ) = 3,2, а СКО »1,79.

Отже, ( -  ) = N (0; 1,79).

Тоді статистика Q = ( -  ) / 1,79 матиме стандартний нормальний розподіл, т. Е Q = N (0, 1). Взявши в якості оцінок генеральних середніх вибіркові оцінки 0 и 0, Розрахуємо фактичне значення статистики критерію: Q = (  ) / 1,79 »2,23.

Задамося рівнем значимості 5%. Побудуємо двосторонню критичну область: якщо фактичний критерій потрапляє в неї, то це означає, що різниця між середніми занадто істотно відрізняється від нуля в ту або іншу сторону; і тоді гіпотезу про рівність середніх треба відкинути. По таблиці функції Лапласа знайдемо межі цієї області: Ф (QКР2) = 0,5 - 0,05 / 2 = 0,475, тоді QКР2 = 1,96; QКР1 = -1,96. Так як 2,23> 1,96, гіпотеза Н0 відкидається, т. е регулювання машини порушена. Однак, існує п'ятивідсоткова ймовірність, що цей висновок зроблено випадково (т. Е насправді з машиною все гаразд, просто були зроблені невдалі вибірки).

Задамося рівнем значущості 2%. Тоді кордону критичної області знайдемо по таблиці функції Лапласа для значення цієї функції Ф (QКР2) = 0,5 - 0,02 / 2 = 0,49, тоді тоді QКР2 = 2,34; QКР1 = -2,34. Так як 2,23> 2,34, на двопроцентному рівні значущості можна прийняти нульову гіпотезу. Т. Є. вважати, що регулювання машини не порушена.


Функція Лапласа (таблиця значень)

x  ? (x) x  ? (x) x  ? (x) x  ? (x)
 0,65  0,2422  1,3  0,4032  1,95  0,4744
 0,01  0,004  0,66  0,2454  1,31  0,4049  1,96  0,475
 0,02  0,008  0,67  0,2486  1,32  0,4066  1,97  0,4756
 0,03  0,012  0,68  0,2517  1,33  0,4082  1,98  0,4761
 0,04  0,016  0,69  0,2549  1,34  0,4099  1,99  0,4767
 0,05  0,0199  0,7  0,258  1,35  0,4115  0,4772
 0,06  0,0239  0,71  0,2611  1,36  0,4131  2,02  0,4783
 0,07  0,0279  0,72  0,2642  1,37  0,4147  2,04  0,4793
 0,08  0,0319  0,73  0,2673  1,38  0,4162  2,06  0,4803
 0,09  0,0359  0,74  0.2703  1,39  0,4177  2,08  0,4812
 0,1  0,0398  0,75  0,2734  1,4  0,4192  2,1  0,4821
 0,11  0,0438  0,76  0,2764  1,41  0,4207  2,12  0,483
 0,12  0,0478  0,77  0,2794  1,42  0,4222  2,14  0,4838
 0,13  0,0517  0,78  0,2823  1,43  0,4236  2,16  0,4846
 0,14  0,0557  0,79  0,2852  1,44  0,4251  2,18
 0,15  0,0596  0,8  0,2881  1,45  0,4265  2,2  0,4861
 0,16  0,0636  0,81  0,291  1,46  0,4279  2,22  0,4868
 0,17  0,0675  0,82  0,2939  1,47  0,4292  2,24  0,4875
 0,18  0,0714  0,83  0,2967  1,48  0,4306  2,26  0,4881
 0,19  0,0753  0.84  0,2995  1,49  0,4319  2,28  0,4887
 0,2  0,0793  0,85  0,3023  1,5  0,4332  2,3  0,4893
 0,21  0,0832  0,86  0,3051  1,51  0,4345  2,32  0,4898
 0,22  0,0871  0,87  0,3078  1,52  0,4357  2,34  0,4904
 0,23  0,091  0,88  0,3106  1,53  0,437  2,36  0,4908
 0,24  0,0948  0,89  0,3133  1,54  0,4382  2,38  0,4913
 0,25  0,0987  0,9  0,3159  1,55  0,4394  2,4  0,4918
 0,26  0,1026  0,91  0,3186  1,56  0,4406  2,42  0,4922
 0,27  0,1064  0,92  0,3112  1,57  0,4418  2,44  0,4927
 0,28  0,1103  0,93  0,3238  1,58  0,4429  2,46  0,4931
 0,29  0,1141  0,94  0,3264  1,59  0,4441  2,48  0,4934
 0,3  0,1179  0,95  0,3289  1,6  0,4452  2,5  0,4938
 0,31  0,1217  0,96  0,3315  1,61  0,4463  2,52  0,4941
 0,32  0,1255  0,97  0,334  1,62  0,4474  2,54  0,4945
 0,33  0,1293  0,98  0,3365  1,63  0,4484  2,56  0,4948
 0,34  0,1331  0,99  0,3389  1,64  0,4495  2,58  0,4951
 0,35  0,1368  0,3413  1,65  0,4505  2,6  0,4953
 0,36  0,1406  1,01  0,3438  1,66  0,4515  2,62  0,4956
 0,37  0,1443  1,02  0,3461  1,67  0,4525  2,64  0,4959
 0,38  0,148  1,03  0,3485  1,68  0,4535  2,66  0,4961
 0,39  0,1517  1,04  0,3508  1,69  0,4545  2,68  0,4963
 0,4  0,1554  1,05  0,3531  1,7  0,4554  2,7  0,4965
 0,41  0,1591  1,06  0,3554  1,71  0,4564  2,72  0,4967
 0,42  0,1628  1,07  0,3577  1,72  0,4573  2,74  0,4969
 0,43  0,1664  1,08  0,3599  1,73  0,4582  2,76  0,4971
 0,44  0,17  1,09  0,3621  1,74  0,4591  2,78  0,4973
 0,45  0,1736  1,1  0,3643  1,75  0,4599  2,8  0,4974
 0,46  0,1772  1,11  0,3665  1,76  0,4608  2,82  0,4976
 0,47  0,1808  1,12  0,3686  1,77  0,4616  2,84  0,4977
 0,48  0,1844  1,13  0,3708  1,78  0,4625  2,86  0,4979
 0,49  0,1879  1,14  0,3729  1,79  0,4633  2,88  0,498
 0,5  0,1915  1,15  0,3749  1,8  0,4641  2,9  0,4981
 0,51  0,195  1,16  0,377  1,81  0,4649  2,92  0,4982
 0,52  0,1985  1,17  0,379  1,82  0,4656  2,94  0,4984
 0,53  0,2019  1,18  0,381  1,83  0,4664  2,96  0,4985
 0,54  0,2054  1,19  0,383  1,84  0,4671  2,98  0,4986
 0,55  0,2088  1,2  0,3849  1,85  0,4678  0,49865
 0,56  0,2123  1,21  0,3869  1,86  0,4686  3,2  0,49931
 0,57  0,2157  1,22  0,3888  1,87  0,4693  3,4  0,49966
 0,58  0,219  1,23  0,3907  1,88  0,4699  3,6  0,499841
 0,59  0,2224  1,24  0,3925  1,89  0,4706  3,8  0,499928
 0,6  0,2257  1,25  0,3914  1,9  0,4713  0,499968
 0,61  0,2291  1,26  0,3962  1,91  0,4719  4,5  0,499997
 0,62  0,2324  1,27  0,398  1,92  0,4726  0,5
 0,63  0,2357  1,28  0,3997  1,93  0,4732    
 0,64  0,2389  1,29  0,4015  1,94  0,4738    

http://lab4students.narod.ru/din.html


* Нагадаємо сенс знака "!" (Факторіал):  0! = 1.

* Підкреслимо, що тут нерівність а ? -300 - нестроге, т. Е
 F (-300) = 0.

* Відзначимо, що в цій формулі не важливо, як написати: х

Точкові та інтервальні оцінки | Комп'ютерні мережі можна класифікувати за різними ознаками.


Біноміальний розподіл | Щільність і функція розподілу. Безперервні випадкові величини | Рівномірний розподіл неперервної випадкової величини | Нормальний розподіл | варіаційні ряди | Графічне представлення варіаційних рядів | Середні варіаційного ряду | оцінки розкиду | Вибіркові оцінки параметрів генеральної сукупності | Властивості статистичних оцінок |

© um.co.ua - учбові матеріали та реферати