Головна

Теорія ймовірностей і математична статистика - основний інструментарій для прикладної статистики

  1.  Amp; 13. Спорідненість як найважливіша підстава виникнення сімейних правовідносин. Теорія соціального спорідненості.
  2.  I, 5: ЛОГІКА І ТЕОРІЯ ПІЗНАННЯ В санкхье-йоги
  3.  I. СТАТИСТИКА ОСНОВНИХ ВИРОБНИЧИХ ФОНДІВ
  4.  II. матеріалістична теорія
  5.  II. НАША фабрично-заводського СТАТИСТИКА
  6.  II. Безпосереднє обчислення ймовірностей
  7.  II. Про двох особливостях Жовтневої революції, чи жовтень і теорія "перманентної" революції Троцького

Математична статистика

Випадкова величина - Змінна величина, яка приймає одне з можливих значень в залежності від випадкових обставин. Випадкова величина вважається повністю заданій своїм розподілом, якщо зазначений закон, за яким можна обчислити вірогідність попадання випадкової величини в будь-яка підмножина її можливих значень.

Розподіл ймовірностей - сукупність всіх можливих значень випадкової величини і відповідної ним вірогідності.

Випадкова величина називається дискретної, Якщо вона приймає кінцеве або лічильної число значень. Дискретна величина задається за допомогою ряду розподілу - функції, що ставить у відповідність кожному можливому значенню випадкової величини певну ймовірність. Таким чином, ряд розподілу - це кінцеве або рахункове безліч пар елементів:

Так як випадкова величина Х прийме обов'язково якесь із своїх значень  , Сума ймовірностей  всіх можливих значень дорівнює одиниці, т. е.  для випадкової величини, що приймає кінцеве число n можливих значень, і  для дискретної випадкової величини, що приймає рахункове число значень.

Зазвичай ряд розподілу зручно зображати у вигляді таблиці, де у верхньому рядку вказані можливі значення  дискретної випадкової величини Х, в нижній - відповідні ймовірності того, що Х прийме значення .

Х = .

полігоном (Многоугольником) розподілу називається графічне зображення ряду розподілу. Для того щоб побудувати полігон розподілу необхідно відкласти можливі значення випадкової величини  по осі абсцис, а відповідні їм ймовірності по осі ординат.

безліч значень безперервної випадкової величини незліченно і звичайно являє собою деякий проміжок, кінцевий або нескінченний. Безперервна величина приймає можливі значення, що заповнюють суцільно заданий інтервал, причому для будь-якого х з цього інтервалу існує межа:

функція  називається щільністю розподілу або диференціальним законом розподілу.

Щільність розподілу має такі властивості:

1) ;

2) Для будь-яких <  виконується рівність: =

3) Інтеграл по всій числовій прямій від щільності розподілу ймовірностей дорівнює 1, т. Е. .

4) Імовірність того, що неперервна випадкова величина прийме конкретне значення, дорівнює 0, т. Е. .

Графік щільності розподілу носить назву кривої розподілу.

Функцією розподілу F (x) випадкової величини Х, Що приймає будь-яке дійсне значення x, Називається ймовірність того, що випадкова величина Х прийме значення менше ніж х, тобто  . функцію розподілу F (x) називають також інтегральним законом розподілу.

Для дискретної випадкової величини функція F (x) обчислюється за формулою:

,

де підсумовування здійснюється за всіма значеннями i, для яких .

Для неперервної випадкової величини інтегральний закон виражається формулою:  , Де функція  - Щільність розподілу.

функцією розподілу F (x) має такі властивості:

1) = F (x2) - F (x1);

2)  , якщо ;

3) ;

4) ;

5)  (Для неперервної випадкової величини).

Графік функції розподілу F (x) для безперервних випадкових величин називається інтегральної кривої розподілу.

Числові характеристики випадкових величин. Функція розподілу дає повну інформацію про закон розподілу випадкової величини. Однак часто буває досить знати одну або кілька числових характеристик випадкової величини, що дають наочне уявлення про неї, наприклад, деякий «середнє» число, навколо якого групуються значення випадкової величини (центр групування розподілу), і ту чи іншу характеристику варіації значень випадкової величини (ступінь розсіювання її значень).

Основний характеристикою центру групування випадкової величини в генеральній сукупності є її математичне очікування. Вибірковим аналогом математичного очікування є середнє значення .

Математичне очікування М (х) дискретної випадкової величини визначається за формулою:  (1.1)

Якщо випадкова величина Х неперервна і  - Її щільність розподілу, то математичним очікуванням називається інтеграл:

 , (1.2)

в тих випадках, коли існує інтеграл .

Наведемо без доказів основні властивості математичного очікування.

1. Математичне сподівання постійної одно цієї постійної, т. Е. Якщо с - Постійна, то М (Х) = з .

2. Постійну величину можна виносити за знак математичного очікування, т. Е. Якщо Х - випадкова величина, а с - Постійна, то М (сХ) = з * М (Х).

3. Математичне сподівання суми випадкових величин дорівнює сумі математичних очікувань цих випадкових величин, т. Е. Якщо визначені МХ и МY, То визначено математичне очікування М (Х + Y), причому М (Х + Y) = МХ + МY. Це властивість вірно як для залежних, так і незалежних випадкових величин.

4. Математичне сподівання добутку незалежних випадкових величин дорівнює добутку математичних сподівань цих випадкових величин, т. е. якщо Х и Y - Незалежні випадкові величини, то М (ХY) = МХ * МY.

модальне значення (або просто мода) Мо випадкової величини визначається як таке можливе значення досліджуваної ознаки, при якому значення щільності ймовірності  (В безперервному випадку) або ймовірності  (В дискретному випадку) досягає свого максимуму. Мода є найбільш часто зустрічається значення випадкової величини.

Медіана Ме досліджуваної ознаки визначається як його средневероятному значення, т. Е. Таке значення, яке має наступну властивість: ймовірність того, що випадкова величина виявиться більше Ме, дорівнює ймовірності того, що вона виявиться менше. Для володіють безперервної щільністю випадкових величин виконується умова:

 (1.3)

і медіану можна визначити як таке значення  на осі абсцис, при якому пряма, паралельна осі ординат і проходить через точку  ділить площу під кривою щільності на дві рівні частини. У деяких випадках дискретних розподілів може не існувати величини, точно задовольняє сформульованим вимогу. Тому для дискретних величин медіану можна визначити як будь-який  , Що лежить між сусідніми можливими значеннями и  , Такими, що  <0,5 і  0,5.

характеристики варіації уточнюють уявлення про розподіл ймовірностей випадкової величини. Вони дають уявлення про ступінь розсіювання випадкової величини щодо центру групування. Найбільш часто використовуваними характеристиками варіації є дисперсія випадкової величини і її середньоквадратичне відхилення.

Дисперсією випадкової величини Х називається число DX, рівне математичного сподівання квадрата відхилення випадкової величини від свого математичного очікування:  . (1.4)

Якщо відомий закон розподілу випадкової величини Х, То для дискретної і безперервної випадкових величин дисперсію можна обчислити відповідно за формулами:  (1.5)

 , (1.6)

де  - Щільність розподілу випадкової величини.

В якості запобіжного розсіювання випадкової величини поряд з дисперсією використовують середньоквадратичне відхилення  , Рівне квадратному кореню з дисперсії випадкової величини: =  . (1.7)

Середньоквадратичне відхилення випадкової величини виражається в тих же одиницях, що і сама випадкова величина і її математичне сподівання.

Наведемо без доказів основні властивості дисперсії. Властивості середнє відхилення безпосередньо випливають з відповідних властивостей дисперсії.

1) Дисперсія постійної с дорівнює нулю: D (c) = 0.

2) Дисперсія твори випадкової величини Х на постійну с дорівнює добутку дисперсії випадкової величини Х на квадрат постійної: .

3) Якщо випадкові величини X иY незалежні, то дисперсія їх суми дорівнює сумі їх дисперсій: .

4) Дисперсія випадкової величини Х не зміниться, якщо до неї додати постійну с, Т. Е. .

Моменти випадкової величини узагальнюють поняття математичного очікування і дисперсії.

Моментом k - порядку називається математичне очікування k -го ступеня відхилення випадкової величини Х від деякої постійної с.

Якщо в якості с береться нуль, моменти називають початковими, тобто

 . (1.8)

якщо з = М (Х), То моменти називаються центральними, тобто

. (1.9)

Таким чином, математичне очікування - ні що інше, як перший початковий момент, а дисперсія - другий центральний момент.

Існує формула, що зв'язує центральні моменти з початковими:

 . (1.10)

Для перших чотирьох моментів ця формула дає наступні рівності:

 (1.11)

Формула  може бути використана для знаходження дисперсії випадкової величини:  (1.12)

У теорії і практичних додатках використовують дві числові характеристики випадкової величини, засновані на центральних моментах третього і четвертого порядків відповідно - коефіцієнт асиметрії  і ексцес  . Дані коефіцієнти дають уявлення про форму щільності розподілу або багатокутника розподілу.

Коефіцієнтом асиметрії випадкової величини Х називається число, яке дорівнює відношенню третього центрального моменту до кубу середнє відхилення випадкової величини Х:  (1.13)

Коефіцієнт асиметрії випадкової величини, закон розподілу якої симетричний щодо математичного очікування, дорівнює нулю, оскільки в цьому випадку  . Якщо розподіл ймовірностей несиметрично, причому «довга частина» розподілу розташована праворуч від центру групування, то  > 0 і асиметрію називають позитивною, якщо ж «довга частина» розташована зліва, то  <0 і асиметрію називають негативною.

Вкачестве характеристики більшою чи меншою мірою «сглаженности» щільності або багатокутника розподілу в порівнянні з нормальною щільністю використовують поняття ексцесу. Ексцесом випадкової величини Х називається число, яке дорівнює різниці відносини четвертого центрального моменту до четвертого ступеня середнє відхилення випадкової величини і числа 3:

 (1.14)

Ексцес нормального закону розподілу ймовірностей дорівнює нулю. Якщо розподіл ймовірностей випадкової величини Х одномодальних і щільність розподілу  більш «гостровершинності», ніж щільність розподілу нормальної випадкової величини з тієї ж дисперсією, то  > 0, якщо ж  Проте «гостровершинності» і більш «згладжена» в порівнянні з щільністю відповідного нормального розподілу, то  <0.

У математичній статистиці широко використовуються поняття q-квантилів и Q-процентних точок  розподілу F (x).

Квантиль рівня q (або q-квантиль) Неперервної випадкової величини Х, володіє безперервною функцією розподілу F (x), Називається таке можливе значення  цієї випадкової величини, для якого ймовірність події Х <  дорівнює заданій величині q, Т. Е.  . (1.15)

Очевидно, чим більше задане значення q (0 q <1), Тим більше буде і відповідна величина квантилі  . Окремим випадком квантилі - 0.5 -квантілью є характеристика центру групування - медіана.

Для дискретної випадкової величини функція q-квантіль визначається як будь-яке число  , Що лежить між двома значеннями и  , Такими, що q, але q.

під Q-відсоткової точкою (0 < Q<100) випадкової величини Х розуміється таке її можливе значення  , Для якого ймовірність події Х  , дорівнює Q / 100:

 . (1.16)

Для дискретної випадкової величини це визначення коригується аналогічно тому, як це робилося при визначенні квантилів.

Між Квантиль і відсотками точками існує наступне співвідношення: .

Нормальний розподіл (Закон Гаусса) займає центральне місце в теорії і практиці статистичних досліджень. Розподіл задається щільністю:

 , (1.17)

де  - математичне очікування;  - Середньоквадратичне відхилення.

Крива нормального розподілу симетрична відносно прямої, паралельної осі ординат і проходить через точку  , І має в цій точці єдиний максимум, рівний  . Зі зменшенням  крива стає більш витягнутою по відношенню до прямої  . зміна  при постійному  не змінює форми кривої, а викликає лише її зсув уздовж осі абсцис. Таким чином, нормальний розподіл залежить від двох параметрів: и  . Площа, яка знаходиться під кривою нормального розподілу, дорівнює одиниці. Коефіцієнт асиметрії і ексцес дорівнюють нулю.

Логарифмічно-нормальний розподіл (Логнормальний розподіл) - розподіл позитивної випадкової величини, логарифм якої розподілений за нормальним законом. Таким чином, якщо випадкова величина Х розподілена за нормальним законом, то випадкова величина  має логнормальний розподіл. Розподіл є асиметричним.

Щільність ймовірності задається наступним виразом:

 . (1.18)

Математичне сподівання і дисперсія визначаються за такими формулами:

 ; (1.19)

 , (1.20)

де  - математичне очікування Х;  - Середньоквадратичне відхилення Х.

Біноміальний розподіл - Розподіл ймовірностей дискретної випадкової величини X = m, Що приймає значення 0,1,2, ..., n і задається функцією ймовірностей:

 , (1.20)

де  - Ймовірність появи події А m раз в n незалежних випробуваннях, в кожному з яких подія А з'являється з одне і тією ж імовірністю p і не з'являється з ймовірністю ;

 - Число сполучень із n по m.

Параметрами розподілу є величини n и р. Математичне сподівання і дисперсія задаються наступним чином:

 (1.21)

Рівномірний розподіл - Розподіл ймовірностей неперервної випадкової величини на будь-якому відрізку  , де  , Що має щільність:

 при  (1.22)

Математичне сподівання і дисперсія відповідно рівні:

 (1.23)

Контрольні питання і завдання

1.1. Дано випадкові величини X і Y, причому Х = 5Y + 6. Дисперсія випадкової величини Y дорівнює D (Y). Виберіть правильне значення D (X):

1) D (Y) 2) 5D (Y) + 6 3) 25 D (Y) 4) D (Y)

1.2. Відомо, що M (X) = 6, M (Y) = 7. Визначте М (XY).

1.3. Якщо ексцес більше нуля, то:

1) варіаційний ряд має більш крутий шпиль в порівнянні з нормальною кривою;

2) варіаційний ряд має більш пологу вершину в порівнянні з нормальною кривою.

1.4. В результаті розрахунків визначено вибіркове середньоквадратичне відхилення s= 0,031 і вибіркові моменти  = -0,001 І  = 0,0018. Розрахуйте коефіцієнт асиметрії і ексцес.

1.5. Дано початкові моменти  = 3,4;  = 11,5;  = 40,4;  = 144,3. Визначте центральні моменти , , .

1.6. Медіана є:

1) 0,25 -квантілью 2) 0,5 -квантілью 3) 0,75 -квантілью

 в певному інтегралі. |  статистичне оцінювання


 Тема 3. Статистична перевірка гіпотез |  Тема 4. Методика статистичного аналізу кількісних і якісних показників |  Тема 5. Багатовимірні статистичні методи |

© 2016-2022  um.co.ua - учбові матеріали та реферати