На головну

Р "Р ° С,Р ° РїСѓР ± Р» РёРєРѕРІР ° РЅРёСЏ: 2014-11-29; РџСЂРѕС ‡ РёС,Р ° РЅРѕ: 61 |

Лекція 6. Математична статистика

  1.  D. Статистика обладнання
  2.  F-статистика
  3.  Антонов А. і., Борисов В. а. Лекції по демографії. М., 2011. Лекція 7. С. 373-416.
  4.  Б.3.03. ТЕОРІЯ ЙМОВІРНОСТЕЙ І МАТЕМАТИЧНА СТАТИСТИКА
  5.  У менюСервісвиберемАналіз даних, потім Описова статістікаі натиснемо ОК.
  6.  В.3.01. МАТЕМАТИЧНА ЛОГІКА
  7.  Вступна лекція

У логіці першого порядку (логіці предикатів) умови ефективного застосування методу резолюцій для доведення теорем такі ж, як і в логіці висловлювань. Нагадуємо, що одна з цих умов - це уявлення теорем в ПКНФ. Правила еквівалентних перетворень формул, введені в логіці висловлювань, рівнозначні і для логіки першого порядку. Однак присутність в формулах кванторів загальності та існування ускладнює застосування теорем до ПКНФ.

У зв'язку з цим додатково вводяться ряд правил, що дозволяють виключити зазначені квантори з формул. Ці правила діляться на дві групи:

1) Правила освіти попереджання нормальних форм (ПНФ);

2) Правила освіти Скулемовскіх стандартних форм (ССФ).

Розглянемо ці форми і правили їх утворення.

Формула F знаходиться в попереджання нормальній формі (ПНФ), тоді і тільки тоді, коли вона має вигляд:

 де кожне  1, n є або  ), Або  , і  є формула, яка містить кванторів.  називається префіксом, а  - Матрицею формули F.

Наприклад, у формулі

префікс  передує матрицю

Розглянемо правила еквівалентних перетворень формул, що містять квантори.

нехай  є формула, яка містить вільну змінну  . Будемо позначати цю формулу  . нехай  є формула, яка не містить змінної  . нехай  є квантор  або квантор  . Тоді правила такі:

1a)

1b)

 2a)

 2b)

3a)

3b)

4a) (

4b)

Використовуючи правила еквівалентних перетворень формул логіки висловлювань і зазначені вісім правил, завжди можна перетворити будь-яку формулу в ПНФ. Розглянемо приклад.

Наведемо формулу  до ПНФ. Використовуючи правило виключення зв'язки імплікації, отримаємо:

.

За правилом 2a маємо:

.

Нарешті, використовуючи правило 3b, отримаємо:

.

Формула в правій частині останнього співвідношення представлена ??в попереджання нормальній формі (ПНФ).

Скулемовская стандартна форма - Це ПНФ, в префікс якої відсутні квантори існування  , А матриця  є наведеної кон'юнктівной нормальною формою (ПКНФ). З цього визначення стає очевидним, що скулемовскіе перетворення формул спрямовані на виключення кванторів існування з попереджання нормальних форм. Розглянемо ці правила перетворення.

нехай формула  знаходиться в попереджання нормальній формі, де  є ПКНФ. Покладемо, що  є квантор існування в префікс .

Якщо ніякої квантор загальності не варто в префікс лівіше  , То виберемо нову константу  , Що відрізняється від інших констант, що входять в  , Замінимо всі  , Що зустрічаються в  , На константу  і викреслимо  з префікса. якщо  - Список всіх кванторів загальності, що зустрічаються лівіше ,  то виберемо новий  місцевий функціональний символ  , Що відрізняється від інших функціональних символів, замінимо всі в  на  і викреслимо  з префікса. Потім цей процес застосовуємо для всіх кванторів існування в префікс; остання з отриманих формул є ССФ - скулемовская стандартна форма. Константи і функції, які використовуються для заміни змінних квантора існування, називають скулемовскімі константами і функціями. Розглянемо приклад.

Отримаємо ССФ для формули:

тут лівіше  немає ніяких кванторів загальності, лівіше  стоять и  , А лівіше  стоять , и  . Отже, замінимо змінну  на константу  , змінну  на двомісну функцію  , змінну  на тримісну функцію  . Таким чином, після зазначених замін і вилучення кванторів існування отримаємо наступну стандартну форму для написаної вище формули:

Розглянуті правила еквівалентних перетворень дають можливість уявити будь-яку теорему логіки предикатів в скулемовской стандартній формі. Так як префікс в цій формі містить тільки квантори загальності, то це означає, наприклад, для  що форма отримує значення І, якщо  істинно для кожного  з області  (А в іншому випадку отримує значення Л), то це дає право розглядати  як просте висловлювання і квантор загальності, що зв'язує  , Викреслити з префікса. В рівній мірі цей висновок відноситься і до квантора загальності, що зв'язує інші змінні. Тому для доведення теорем в логіці предикатів можна використовувати тільки матриці, що знаходяться в ПКНФ.

У логіці предикатів доведена також наступна теорема.

нехай  - Безліч диз'юнктів, які представляють ПКНФ в скулемовской стандартній формі деякої формули (теореми)  . тоді формула  суперечлива в тому і тільки в тому випадку, коли безліч  суперечливо.

Механізм застосування методу резолюцій, який використовувався для доведення теорем в логіці висловлювань, може бути застосований і в логіці предикатів. Однак при цьому виникають три істотних питання:

1) як знайти контрарние пари для диз'юнктів, що містять змінні?

2) як обчислити резольвенту з диз'юнктів, що містять змінні?

3) Як отримати максимальну користь з зворотної дедукції з метою підвищення ефективності методу резолюцій?

Відповіді на ці питання вносять деяку специфіку в алгоритм методу резолюцій.

Лекція 6. Математична статистика

план лекції

6.1. Основні поняття математичної статистики

6.2. Точкові оцінки параметрів

6.3. Приклади деяких розподілів

6.1. Основні поняття математичної статистики

Математична статистика - Це розділ математики, присвячений аналізу статистичних даних найрізноманітнішої природи. Є певний зв'язок математичної статистики з теорією ймовірностей, яка не випадково вивчається раніше. У теорії ймовірностей мають справу з вірогідністю випадкових подій, а також з випадковими величинами і їх характеристиками. При цьому передбачається, що цікавлять нас ймовірності або відомі, або їх можна розрахувати. Але в практичних завданнях положення інше. Під час проведення дослідів фіксуються конкретні значення випадкової величини, за якими потім потрібно визначити її числові характеристики і закон розподілу ймовірностей. Особливістю завдання в переважній кількості випадків є неможливість обстежити всі об'єкти спостереження, а значить, маючи в наявності тільки обмежена кількість вимірювань, нам необхідно зробити висновок про поведінку всієї сукупності об'єктів.

Всі безліч досліджуваних об'єктів називається генеральною сукупністю. Число об'єктів називається об'ємом генеральної сукупності. Обсяг генеральної сукупності є кінцевим на відміну від теоретичних розглядів, де він передбачається нескінченним.

Безліч випадковим чином відібраних об'єктів дослідження називається вибірковою сукупністю або вибіркою, а число об'єктів у вибірці - її обсягом. Вироблена вибірка повинна досить повно відображати властивості всіх об'єктів генеральної сукупності. Особливо це важливо, коли генеральна сукупність має деяку неоднорідність об'єктів. Така вимога до вибірці формулюється так: вибірка повинна бути репрезентативною (представницької). Репрезентативність вибірки забезпечується випадковістю відбору при однаковій ймовірності будь-якого об'єкта потрапити до вибірки.

Проілюструємо це поняття на прикладі. Припустимо, що населення міста складає 100 000 чоловік, серед яких 60% - бідняки, 30% - середній клас, а інші - багатії. Потрібно оцінити середньорічний дохід на душу населення. Оскільки немає ні фінансових, ні фізичних можливостей опитати всіх жителів міста, то вирішили зробити вибірку з 1000 чоловік, і за результатами опитування оцінити середньорічний дохід. Щоб вибірка була репрезентативною, слід випадковим чином вибрати для опитування приблизно 600 будинків, 300 осіб із середнім достатком і 100 багатіїв. Тільки в цьому випадку середнє арифметичне їх річних доходів буде гарною оцінкою середньорічного доходу жителів цього міста.

Тепер перейдемо до формального боку математичної статистики, Яка, як уже говорилося, визначається як розділ математики, присвячений математичним методам систематизації, обробки і використання статистичних даних для наукових і практичних висновків незалежно від природи досліджуваних об'єктів.

Нехай є генеральна сукупність випадкової величини Х (В наведеному вище прикладі - індивідуальні доходи 100 000 городян), функція розподілу F (x) якої нам невідома, або відома з точністю до декількох параметрів. Тоді вибіркою обсягу n буде випадковий n - Мірний вектор, який має "координати" {х1, х2, ..., хn} (В прикладі - доходи випадковим чином відібраних n городян). Ставиться завдання: за наявною вибірці оцінити основні числові характеристики випадкової величини Х (Математичне сподівання, дисперсію) або зробити висновок про вид функції розподілу.

Оскільки вибірка випадкова, то координати n - Мірного вектора хi невпорядковані, т. е., по-перше, серед них можуть зустрітися однакові величини (рівні доходи), а по-друге, може виконуватися будь-яка з нерівностей: хi + 1 > > xi або хi + 1 i. Для зручності роботи з вибіркою значення xi переставляють так, щоб виконувалися несуворі нерівності: х1 ? х2 ? х3 ? ... ? хn. Така перестановка не приведе ні до втрати інформації, ні до її придбання (просто опитування тих же городян проводився б в іншому порядку).

Деякі значення у вибірці можуть збігатися. Припустимо, все мається k (1 ? k ? n) Різних і розташованих в порядку зростання значень  ; їх називають варіантами, А таку послідовність чисел - варіаційним рядом. різниця -  між найбільшим і найменшим значеннями вибірки називають розмахом вибірки. Припустимо, значення  повторюється ni раз (1 ? i ? k) При дотриманні рівності  . величину ni називають частотою варіанти  , А відношення ni / n відносної частотою Wi. Легко переконатися, що сума відносних частот дорівнює одиниці: .

Дані варіаційного ряду заносимо в таблицю, верхній рядок якої заповнимо варіантами ,  , ...,  , А нижню - відповідними відносними частотами  . Така таблиця називається таблицею статистичного розподілу вибірки або просто статистичної таблицею. Статистична таблиця в разі відсутності повторюваних значень в варіаційному ряду має вигляд табл. 6.1, а для вибірки з повторюваними значеннями - табл. 6.2.

 ...
Wi 1 / n 1 / n 1 / n ... 1 / n 1 / n

Табл. 6.1

...
Wi ...

табл.6.2

Зауважимо, що таблицю статистичного розподілу вибірки можна вважати таблицею розподілу деякої гіпотетичної випадкової дискретної величини, що приймає значення ,  , ...,  з вірогідністю  . В силу цієї аналогії можна за тими ж формулами, які використовувалися для дискретного розподілу в теорії ймовірностей, за відомим емпіричному розподілу знайти вибіркові аналоги математичного очікування, дисперсії і емпіричної функції розподілу.

Якщо обсяг вибірки з генеральної сукупності деякої випадкової безперервної величини великий, то вдаються до попередньої угруповання даних: інтервал значень цієї величини розбивають на k інтервалів (при цьому їх довжини не обов'язково повинні бути однакові). При виборі кількості інтервалів керуються формулою k = log2 n + 1. Підраховують, скільки значень n1 , n2 , ..., Nk потрапило в кожен з k інтервалів (n1 + n2 + ... + Nk = = n). Варіантами для асоційованої вибірки вважають середини цих інтервалів ,  , ...,  . Ці дані заносять в статистичну таблицю розподілу вибірки (табл. 6.2).

Для наочного уявлення статистичного розподілу користуються графічними зображеннями варіаційних рядів: полігоном (Для випадкової дискретної величини) і гистограммой (Для безперервної). Полігон отримують, поєднуючи відрізками прямих точки з координатами ( ,  ), i = 1, ..., K. Він є аналогом багатокутника розподілу випадкової дискретної величини в теорії ймовірностей. Гістограма - це ряд прямокутників, підставами яких є відрізки довжиною -  , А їх висоти рівні  . При такому виборі сторін прямокутників досягається рівність одиниці площі всієї цієї ступінчастою фігури. Гістограма є аналогом щільності ймовірностей випадкової безперервної величини. Приклади полігону і гістограми наведені відповідно на рис. 5.1 і 5.2.

Wi

x1 x2 x3 x4 х5 x6 x7 x

Мал. 6.1

Wi

 
 


       
   
 
 


х

Мал. 6.2

Розглядаючи ці графіки, можна висловити припущення, що в першому випадку випадкова величина має рівномірний розподіл, а в другому - нормальне. Оцінка правомірності цих гіпотез становить окрему главу математичної статистики.

П р и м і р № 1. На прийомних іспитах випадкова вибірка серед абітурієнтів дала наступні набрані ними бали: 12. 11, 12, 10, 10, 9, 14, 12, 13, 10, 11, 11, 15, 9, 12, 12, 11, 9, 9 , 10, 11, 11, 14, 13, 9, 11, 12, 9, 11, 13. Побудувати для даної вибірки варіаційний ряд, полігон і емпіричну функцію розподілу, знайти моду і медіану.

Рішення . Розташуємо дані вибірки в порядку їх зростання, або іншими словами, складемо варіаційний ряд: 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 12, 1, 13, 13, 14, 14, 15. Числа  є варіантами з числом повторень відповідно n1 = 6, n2 = 4, n3 = 8, n4 = 6, n5 = 3, n6 = 2, n7 = 1. Обсяг вибірки дорівнює n =  . Дані занесемо в статистичну таблицю розподілу вибірки (табл. 6.3).

Wi  6/30  4/30  8/30  6/30  3/30  2/30  1/30

Табл. 6.3

Побудуємо полігон вибіркового розподілу (рис. 6.3).


Wi

 
 


 
 


... x

0 1 8 9 10 11 12 13 14 15

Мал. 6.3

модою розподілу Мо є варіанти 11, для якої відносна частота найбільша. медіана Ме обчислюється за формулою:

Ме = .

1

0,5

               
   
 
 
 
   
 
   


 . . . .

0 1 8 9 10 11 12 13 14 15 x

Мал. 6.4

Емпірична функція розподілу  (Рис. 6.4), відповідна отриманої статистичної таблиці розподілу, будується за тією ж методикою, що і в теорії ймовірностей. Вона має ступінчастий вигляд: в точках (i = 1, 2, ..., 7) є "скачки" величиною Wi , причому  = 0 для x < и  = 1 для x > .

П р и м і р № 2. Вимірювання товщини (в мм) слюдяних прокладок дали наступні результати: 0,042; 0,030; 0,039; 0,031; 0,042; 0,034; 0,036; 0,030; 0,033; 0,024; 0,031; 0,040; 0,031; 0,033; 0,031; 0,022; 0,031; 0,034; 0,027; 0,032; 0,048; 0,030; 0,026; 0,031; 0,043; 0,030; 0,033; 0,028; 0,028; 0,032; 0,039; 0,031; 0,034; 0,031; 0,035; 0,037; 0,025; 0,029; 0,027; 0,031; 0,028; 0,030; 0,029; 0,045; 0,033; 0.046; 0,036; 0,049; 0,021; 0,037. Побудувати гістограму.

Рішення. Обсяг вибірки дорівнює n = 50. Згрупуємо дані в інтервали, число яких знайдемо за формулою: k = log250 + 1 = 6,6. Округлимо це число до найближчого цілого, перевищує отримане: k = 7. Оскільки розмах вибірки дорівнює xmax - xmin = 0,049 - 0,021 = 0,028 мм, то кожен з інтервалів становить 0,004 мм. Порахуємо, скільки виміряних значень потрапило до відповідних інтервали, і складемо статистичну таблицю розподілу групувати даних (табл. 6.4), доповнивши її необхідною для побудови гістограми рядком, що містить значення  (за умовою Dx = 0,004).

Зауважимо, що обсяг вибірки .

Як варіант візьмемо середини проміжків:

D хi  [0.021- 0.025)  [0.025-0.029)  [0.029-0.033)  [0.033-0.037)  [0.037-0.041)  [0.041-0.045)  [0.045-0.049]
Wi  3/50  7/50  18/50  10/50  5/50  3/50  4/50
Wi/ Dx

Табл. 6.4

Wi / Dx

           
   
 
     


 0,021 0,025 ... 0,049 х

Мал. 6.5

Гістограма, відповідна отриманої статистичної таблиці, зображена на рис. 6.5. Вона є аналогом щільності ймовірності випадкової безперервної величини Х - Товщини слюдяною прокладки.

6.2. Точкові оцінки параметрів

Нехай є вибірка (x1, x2, ..., Xn) З деякою генеральної сукупності. Записавши якесь математичне вираз, що містить ці значення, отримаємо функцію вибірки Zn (x1, x2, ..., Xn), Яка сама буде випадковою величиною в силу того, що в вибірку відбираються випадкові елементи з генеральної сукупності. Наприклад, можна розглянути середнє арифметичне значення вибірки (аналог математичного очікування в теорії ймовірностей), яке називається вибірковим середнім: ( x1+ x2+ ... + Xn ) / n. Розкид же значень у вибірці можна характеризувати виправленої вибіркової дисперсією: .

Завдання оцінки невідомого параметра l (наприклад, м (Х) або D (Х)), Який будь-яким чином пов'язаний з генеральною сукупністю, породженої функцією розподілу випадкової величини Х, На підставі отриманої вибірки (х1, х2, ..., Хn), Означає наступне. Треба задати (придумати!) Таку функцію вибірки Zn, Реалізація якої Zn = Z(х1, х2, ..., Хn) В певному сенсі могла б розглядатися як «добрий» наближене значення параметра l, т. Е. Має виконуватися умова l » Zn .

Така функція вибірки Zn = Z(х1, х2, ..., Хn) називається точкової оцінкою параметра l. Нереалізована значення функції вибірки Zn будемо називати вибірковим (або емпіричним) значенням параметра l.

точкова оцінка Zn = Z(х1, х2, ..., Хn) Параметра l називається несмещенной, якщо М(Zn) = L.

точкова оцінка Zn параметра l називається заможної, якщо Р(|Zn - L | n ® ?, де e - як завгодно мале позитивне число. Тобто спроможність оцінки означає, що при дуже великій вибірці і як завгодно малому e > 0, ймовірність події (| Zn - L |

Нас будуть цікавити оцінки Р(Х = А) - Ймовірності події А, Математичного очікування м (Х), дисперсії D (Х) і коефіцієнта кореляції Gxy. Основні вимоги, що пред'являються до їх оцінками, складаються в несмещённостіі спроможності.

Ми будемо використовувати такі оцінки  чотирьох, перерахованих вище параметрів М(Х), D (Х), р (Х = А), Gху:

1)  - Вибіркове середнє;

2)  - Виправлена ??вибіркова дисперсія;

3)  - Частота події А, де  , Якщо подія А відбулося в i - Ом досвіді, і  , Якщо воно не відбулося. величину  можна розглядати як оцінку ймовірності Р в схемі випробувань Бернуллі.

Якщо в генеральної сукупності міститься дві цікаві для нас випадкові величини Х и Y, То вибірка обсягу n складається з послідовності пар  В цьому випадку оцінка коефіцієнта кореляції випадкових величин Х и Y здійснюється за формулою:

 де

Можна довести, що наведені вище оцінки  є несмещённимі і заможними точковими оцінками.

Наведені формули для обчислення  відповідають Не групуватись вибірках. Якщо проведена угруповання вибірки обсягу n і отримана статистична таблиця у вигляді табл. 6.2, то розрахунок проводять за формулами:

З а м е год а зв і е. На практиці часто користуються для оцінки дисперсії D(X) вибіркової дисперсією  . але  виявляється оцінкою зміщеною, т. е. М(  ) ? D(X). При великих значеннях n значення виправленої вибіркової дисперсії  і вибіркової дисперсії  практично збігаються  . Тому при невеликих обсягах вибірки краще використовувати оцінку  , Яку отримують за формулою  . А про точкову оцінку  можна сказати, що вона є несмещенной тільки асимптотично (при n >> 1).

З а д а ч а. Повернемося до вибірці для товщини слюдяних прокладок, наведеної в прикладі № 2 п.6.1. Необхідно знайти оцінки параметрів М(Х), D(Х) і  - Математичного очікування, дисперсії і середньоквадратичного відхилення для товщини слюдяною прокладки.

Рішення. Спочатку обчислюємо вибіркове середнє:

= (0,023 ? 3 + 0,027 ? 7 + 0,031 ? 18 + 0,035 ? 10 + 0,039 ? 5 + 0,043 ? 3 + 0,047 ? 4) / 50 =

= 0,03356 мм.

Тепер знаходимо вибіркову дисперсію: =

= (0,0232 ? 3 + 0,0272 ? 7 + 0,0312 ? 18 + 0,0352 ? 10 + 0,0392 ? 5 + 0.0432 ? 3 +

+ 0,0472 ? 4) / 50 - 0,033562 = 3,82464 ? 10-5 мм2.

Виправлена ??вибіркова дисперсія легко знаходиться:

=  ? 3,82464 ? 10-5 = 3,9027 ? 10-5 мм 2.

Вибіркове середньоквадратичне відхилення товщини прокладки одно

Через те, що в асоційованої вибірці беруть участь вже тільки середини інтервалів розбиття, угруповання вибірки призводить до деякої втрати інформації, що міститься у вихідній вибірці. Тому, виходячи з досвіду, обсяг вибірки n беруть досить великим (не менше кількох десятків), а число інтервалів розбиття k - В межах від 5 до 15. У цьому випадку різниця в оцінках параметрів розподілу, отриманих за асоційованої і не асоційованої вибірках, виявляється незначною. Так, в тільки що розглянутому прикладі оцінки М(Х) і s, Обчислені по асоційованої вибірці, виявилися рівними:  А якщо вибірки не групувати, то для оцінок М(Х) і s вийдуть відповідно значення 0,0331 мм і 6,25 мк, Що досить незначно відрізняється від значень оцінок за асоційованої вибірці.

З а м е год а зв і е. У разі малих або, навпаки, великих значень  для спрощення обчислення  корисно використовувати формулу, що дозволяє оперувати з звичними числами:

,

де числа C1 и C вибираються, виходячи з зручностей обчислень.

Наприклад, обчислення  в попередньому прикладі простіше здійснити за формулою: .

На закінчення відзначимо, що можливість обчислення значень  передбачена в "інженерних" і "наукових" калькуляторах.

6.3. Приклади деяких розподілів

У лекції 2 описано нормальний розподіл випадкової безперервної величини. Щільність ймовірності нормального розподілу величини Х, Що має математичне очікування М(Х) = а і дисперсію D(Х) = S2 має вигляд

.

Безліч нормально розподілених випадкових величин з параметрами а і s2 позначається N(а, s2). У теорії ймовірностей доводиться, що сума нормально розподілених випадкових величин має нормальний розподіл. Тому випадкова величина  , де - незалежні випадкові величини, буде нормально розподілена з параметрами а и  . Іншими словами,

З а м е год а зв і е. рівності  були отримані в кінці п. 6.3 (завдання № 2).

нехай (х1, х2, ..., Хn) - Математична вибірка з генеральної сукупності, породженої розподілом  або з генеральної сукупності, утвореної незалежними випадковими величинами з математичним очікуванням а і дисперсією  . Тоді можна довести кілька наступних тверджень.

1. Випадкова величина  має стандартизоване нормальний розподіл N(0; 1) або асимптотично стандартизоване нормальний розподіл, щільність ймовірності якого .

У п. 2.6.2.2 було показано, що якщо x > 0, то  , де  - Функція Лапласа. для будь-якого  маємо

.

Зауважимо, що функція  - Парна:  , А функція Лапласа - непарна: .

Таблиці значень функцій и  для x> 0 наводяться в Додатку (табл. 1 і 2).

2. Розглянемо схему випробувань Бернуллі, де в кожному з n дослідів подія А реалізується з імовірністю р. Введемо випадкові величини: хi = 1, якщо в i-ом досвіді відбулася подія А, і хi = 0, якщо в i-ом досвіді подія А не відбулося. Утворити випадкову величину .

Доводиться, що випадкова величина  має асимптотично стандартизоване розподіл, т. е. при досить великому числі дослідів .

3. Випадкова величина  , де  , Називається відношенням Стьюдента з (n - 1) ступенем свободи. Пояснимо остання обставина. величина Т залежить від випадкових величин  (в силу того, що  ) і S, Т. Е. Т залежить від (n + 1) випадкової величини. Але серед цих випадкових величин є дві функціональні зв'язку: и  . Тому незалежних випадкових величин, що беруть участь у формуванні випадкової величини Т, буде  , Що і є її числом ступенів свободи.

Зауважимо, що в теорії ймовірностей доводиться, що и S - Незалежні випадкові величини.

Позначимо щільність ймовірності випадкової величини Т с  ступенями свободи через  . розподіл величини Т називається розподілом Стьюдента з k ступенями свободи. Відомо, що ця щільність ймовірності - функція парна:  , А також, що .

Таблиці при заданих значеннях m, G, a для визначення значень x > 0, що задовольняють рівності

и ,

наводяться в Додатку (табл.4).

4. Випадкова величина  має розподіл Стьюдента з числом ступенів свободи m = n - 2, якщо  . тут  - Коефіцієнт кореляції випадкових величин X и Y, а  - Його вибіркове значення, рівне .

5. Випадкова величина  має распределеніехі-квадрат с m = n - 1 ступенем свободи. Позначимо щільність ймовірності величини c2 як  . тоді для x > 0 маємо

якщо  , То ймовірність випадкової величини прийняти значення між х1 и х2 дорівнює

Таблиця при заданих параметрах m = n - 1, 0 х, Що задовольняють рівності  , Наводиться в Додатку (табл. 5).

Математичне сподівання і дисперсія для хі-квадрат розподілу рівні  ; мода розподілу, т. е. значення варіанти, для якої щільність ймовірності максимальна, дорівнює xо = m - 2.

Таблиці для визначення х, Що задовольняє рівняння  , Зазвичай наводяться для числа ступенів свободи m в діапазоні:  . Якщо ж m > 30, то використовується той факт, що випадкова величина  розподілена асимптотично нормально, т. е. I , m >> 1. Це дозволяє отримати наближене рішення рівняння  у вигляді  , де Ka - Квантиль порядку a нормального стандартизованого розподілу (квантиль порядку a випадкової величини Х визначається як корінь рівняння F(Ka) =  , Що нормальної випадкової величини виглядає так:  , де  - Функція Лапласа). Якщо величина a близька до 0 або 1, то слід користуватися наближенням .

З а д а ч а № 1. знайти значення х, Яке задовольняє рівняння

 , де m = 100, a = 0,01.

Рішення . Т. к. Число ступенів свободи m = 100> 30, то використовувати табл. 5 не можна. скористаємося формулою  , де Кa - корінь рівняння  , Т. Е.  . За табл. 2 значень функції Лапласа Ф(х) Отримаємо: (-Кa) = 2,33, т. Е. Кa = -2,33. потім обчислюємо .

Якщо ж скористатися формулою  , То отримаємо  . Т. е. Обидва наближення дають практично однакові значення х: 69,3 і 70.

З а д а ч а № 2. У попередньому прикладі візьмемо a = 0,001 і знайдемо х.

Рішення . значення х наступне:  , Де величина Кa задовольняє рівняння  . За табл.2 знаходимо: (-Кa) = 3,08, т. Е. Кa = - 3,08, і тому



 РїСЂР?РґРёРєР ° С,РѕРІ. |  Р> РѕРіРёРєР? РїСЂР?РґРёРєР ° С,РѕРІ

© um.co.ua - учбові матеріали та реферати