Головна

Статистичні гіпотези.

  1.  I. Земська-СТАТИСТИЧНІ ДАНІ за Новоросію
  2.  I. Статистичні таблиці
  3.  X. Статистичні методи вивчення зв'язку явищ
  4.  Абсолютні і відносні величини. Статистичні таблиці та графічне зображення статистичних даних.
  5.  Абсолютні і відносні статистичні показники
  6.  Абсолютні і відносні статистичні показники
  7.  Абсолютні і відносні статистичні показники

Статистичної називають гіпотезу про вид невідомого розподілу або про параметри відомих розподілів20. Так, статистичної буде гіпотеза про те, що змінна в генеральної сукупності розподілена за нормальним законом. Перевіряється гіпотезу називають нульовою (основний) гіпотезою і позначають Я0. Поряд з нульовою розглядається конкуруюча гіпотеза Я, (альтернативна), яка їй суперечить.

Статистичний критерій і перевірка гіпотез. Для перевірки нульової гіпотези (використовується спеціально підібрана випадкова величина, точне або наближене розподіл якої відомо і зазвичай зведено в таблиці. Ця величина називається статистичними критерієм. Позначимо його поки К.

для критерію К фіксується так звана критична область, т. е. сукупність значень критерію, при. яких нульову гіпотезу відкидають. Крапка Ккр називається критичною, якщо вона відокремлює критичну область від області прийняття гіпотези.

Розрізняють правостороннім, лівосторонню і двосторонню критичні області.

Прийняття або відкидання гіпотези проводиться на основі відповідного статистичного критерію з певною ймовірністю. Вважають, що нульова гіпотеза справедлива, якщо ймовірність того, що критерій К прийме значення, більше Ккр, т. е. потрапить в критичну область, дорівнює обраному значенням ймовірності a т. е.

прийнята ймовірність а називається рівнем значущості.

Практично прийняття або відкидання нульової гіпотези проводиться наступним чином: вибирається відповідний критерій (це питання буде обговорюватися далі); обчислюється спостережуване значення критерію КИ, виходячи з емпіричного розподілу; вибирається рівень статистичної значущості (зазвичай 0,05 або 0,01).

По таблиці розподілу критерію К для даного рівня значущості знаходять критичну точку Ккр. якщо Кя > ДоК1>, нульову гіпотезу відкидають, якщо ж КИ < Кку, то її відкидати немає підстави.

Роблячи такі висновки (т. Е. Приймаючи або відкидаючи гіпотезу), можна помилитися двох типів: відкинути гіпотезу, коли вона вірна; прийняти її, коли вона невірна. Тому при прийнятті гіпотези було б невірним вважати, що вона тим самим повністю доведена. Для більшої впевненості необхідно її перевіряти іншими способами (наприклад, збільшити обсяг вибірки).

Відкидають гіпотезу категоричніше, ніж приймають.

Приклади статистичних гіпотез: а) нормальний розподіл має заданий середнє і дисперсію або має заданий середнє (про дисперсії нічого не говориться); б) розподіл нормальне або два невідомих розподілу однакові.

Як критерії найчастіше використовуються випадкові величини, розподілені нормально (Z - критерій), згідно із законом «Фішера (F - критерій Фішера), згідно із законом Стьюдента (T - критерій Стьюдента), згідно із законом хі-квадрат (критерій c2) і т.д.

Як конкретний приклад розглянемо застосування критерію хі-квадрат для перевірки гіпотези про вид розподілу досліджуваної ознаки.

Критерій хі-квадрат. Популярність критерію хі-квадрат обумовлена ??головним чином тим, що застосування його не вимагає попереднього знання закону розподілу досліджуваної ознаки. Крім того, ознака може приймати як безперервні, так і дискретні значення, причому виміряні хоча б на номінальному рівні.

Якщо закон розподілу ознаки невідомий, але є підстави припустити, що він має певний вид А, то критерій X2 дозволяє перевірити гіпотезу: досліджувана сукупність розподілена за законом А. Для перевірки такої гіпотези порівнюються емпіричні (спостережувані) і теоретичні (обчислені в припущенні певного розподілу А) частоти. Випишемо ці частоти:

Як правило, емпіричні і теоретичні частоти будуть відрізнятися. Можливо, що спостережуване відмінність випадково (статистично незначуще) і пояснюється або малим числом спостережень, або способом їх угруповання, або іншими причинами. Але можливо, що розбіжність частот значимо і пояснюється тим, що теоретичні частоти обчислені виходячи з невірної гіпотези про характер розподілу значень розглянутих ознак, генеральної сукупності. критерій c2 відповідає на питання, випадково або пет така розбіжність частот. Як будь-який критерій, c2 доводить справедливість гіпотези, а лише з певною ймовірністю а встановлює її згоду або незгоду з даними

спостереженнями. , Критерій c2 має вигляд

Критична точка розподілу c2 знаходиться (див. табл. Б додатка} за заданим рівнем значущості а і числу ступенів свободи df. Число ступенів свободи знаходять за формулою

df = k - l - r,

де k - число інтервалів варіаційного ряду; r- число параметрів передбачуваного розподілу, які оцінені за даними вибірки (наприклад, для нормального розподілу оцінюють два параметри: m і s2).

Розглянемо приклад, коли ознака оцінювався в термінах «дуже низький», «середній», «дуже високий» і був отриманий наступний ряд розподілу для цих трьох категорій:

Перевіримо гіпотезу про те, що в генеральній сукупності значення цієї ознаки розподілені рівномірно.

Теоретичне розподіл для цих груп отримаємо, якщо припустимо, що ці категорії незалежні, т. Е. Респондент з однаковою ймовірністю може потрапити в будь-яку групу. Очевидно, очікувана (теоретична) частота дорівнюватиме 24/3 = 8 осіб.

Таким чином, маємо наступні емпіричні та теоретичні частоти:

Перевіряється гіпотеза, що число респондентів у всіх трьох категоріях однаково, т. Е. Відмінність розподілу від рівномірного статистично незначуще.

По таблиці розподілу c2, наприклад, для рівня значущості 0,05 і ступеня свободи, рівної df = 3 - 1 = 2, знаходимо критичну точку c2 кр = 5,991. Таким чином, бачимо значення c2 менше c2 кр отже, дані спостережень узгоджуються з нульовою гіпотезою і не дають підстав її відкинути.

Хі-квадрат критерій застосуємо і для перевірки нульової гіпотези про відсутність зв'язків між ознаками в разі, якщо емпіричні дані згруповані не по одному, як вище, а ГКГ кількома ознаками. Наприклад, нехай є вибірка в 190 осіб, чия думка щодо якогось певного питання досліджувалося (табл. 5). Розчленуємо цю вибірку на три незалежних категорії за віком. Розглянемо наступні гіпотези: - не існує відмінності думок щодо цього питання серед різних вікових груп; Н-існує відмінність. Перевіримо гіпотезу для рівня значущості а = 0,05.

Для знаходження очікуваної (теоретичної) частоти в будь-якій клітині таблиці необхідно просто перемножити відповідні маргінальні частоти і розділити твір на підсумкову суму. Наприклад, очікувана частота для клітини (а) дорівнює

Для нашого прикладу df = (4 - 1) (3 - 1) = 6. За табл. Б додатка знаходимо, що c2 кр = 16,812. Отже, потрібно відкинути гіпотезу про те, що немає відмінностей в думці серед неоднакових вікових груп, т. Е. Можна припустити, що існує значуща статистична взаємозв'язок між тим, до якої вікової групи належить респондент, і тією думкою, що він висловлює. Однак величина c2 не говорить про силу зв'язку між змінними, а лише вказує на ймовірність існування такого зв'язку. Для Визначення інтенсивності зв'язку необхідно використовувати Відповідні заходи зв'язку.

Для коректного застосування методів, заснованих на c2, Дослідник повинен забезпечити виконання наступних умов. Вибірку необхідно отримати з незалежних спостережень. Дані можуть бути виміряні на будь-якому рівні, але жодна з очікуваних частот не повинна бути занадто мала (мінімум 5). Якщо ж частоти виявляються менш 5, то необхідно або зменшити ступінь дробности угруповання ознак, об'єднавши сусідні категорії, або звернутися до іншого критерію21.



 Нормальний розподіл. Статистичні гіпотези |  Статистичні взаємозв'язку і їх аналіз

 Адекватність математичних методів. |  Угруповання матеріалу статистичних спостережень |  Ряди розподілу. |  Статистичні таблиці. |  Гістограма. |  Полігон розподілу. |  Кумулята. |  Теоретичне розподіл. |  Середнє значення ознаки. |  Показники коливання (варіації) значень ознак. |

© um.co.ua - учбові матеріали та реферати