загрузка...
загрузка...
На головну

Генеральної сукупності за вибіркою

  1. У вибірці, заданої розподілом відносних частот
  2. Питання 2 Показники якості партії (сукупності) продукції.
  3. Генеральна і вибіркова сукупності. види вибірки
  4. Дисперсія генеральної сукупності відома
  5. Дисперсія генеральної сукупності невідома
  6. Завдання курсу - ефективне використання досягнень всієї сукупності конкретних економічних наук і технічних дисциплін в організації виробництва і управління.

10.1. Точкові оцінки та їх властивості. метод підстановки.

Так як основне завдання математичної статистики полягає в знаходженні розподілу спостережуваної випадкової величини X за даними вибірки та в багатьох випадках вид розподілу X можна вважати відомим, то завдання зводиться до отримання наближених значень невідомих параметрів цього розподілу.

нехай Fx(x,?) - Функція розподілу випадкової величини X, Що містить один невідомий параметр ?, а х1,х2, ...,хn -виборка спостережень цієї випадкової величини. точкової оцінкою невідомого параметра ? називається наближене значення цього параметра, отримане за вибіркою.

Зауважимо, що оцінка  Немає значення деякої функції елементів вибірки, тобто = (х1,х2, ...,хn). Будь-яку функцію елементів вибірки називають статистикою. Для уточнення властивостей статистики (х1,х2, ...,хn) Таких, щоб її значення можна вважати хорошою в деякому сенсі оцінкою параметра ?, Її треба розглядати як функцію випадкового вектора (Х1,Х2, ...,Хn), Однією з реалізацій якого є дана вибірка х1,х2, ...,хn. Так як закон розподілу кожної з випадкових величин Xi, i = 1,2, ...,n, є Fx(x,?), Що є функцією параметра ?, То і розподіл статистики (х1,х2, ...,хn) Також залежить від невідомого параметра ?.

Якість оцінок характеризується наступними основними властивостями:

а) спроможність. оцінка = (х1,х2, ...,хn) називається заможної оцінкою параметра ?, якщо  сходиться по ймовірності до ? при n > ?. Останнє означає, що  при n > ?.

спроможність оцінки  вбольшінстве випадків встановлюється за допомогою наступної теореми.

Теорема1. якщо и  при n > ?, то - Заможна оцінка параметра ?.

б) Незміщеність. оцінка ? називається несмещенной оцінкою параметра ?, Якщо її математичне сподівання дорівнює оцінюваному параметру, тобто .

різниця  називається зміщенням. Для незміщене оцінок систематична помилка оцінювання дорівнює нулю.

Найпростіший метод статистичного оцінювання - метод підстановки або аналогії - полягає в тому, що в якості оцінки тієї чи іншої числової характеристики (середнього, дисперсії і ін.) Генеральної сукупності беруть відповідну характеристику розподілу вибірки - вибіркову характеристику.

приклад 38. нехай х1,х2, ...,хn - Вибірка з генеральної сукупності з кінцевими математичним очікуванням і дисперсією ?2. Використовуючи метод підстановки, знайти оцінку т. Перевірити властивості незсуненості і спроможності отриманої оцінки.

Рішення. За методом підстановки як оцінки т математичного очікування візьмемо математичне очікування розподілу вибірки - вибіркове середнє. Тоді, отримаємо

.

Для перевірки незсуненості і спроможності вибіркового середнього як оцінки т, розглянемо цю статистику як функцію вибіркового вектора (Х1,Х2, ...,Хn). За визначенням вибіркового вектора маємо: M [Xi] = Т и D [Xi] = ?2, i = 1,2, ...,п, причому Xi - Незалежні в сукупності випадкові величини.

В даному випадку будемо мати

,

.

Звідси по визначенню отримуємо, що  - Несмещенная оцінка т, і так як  при n> ?, то в силу теореми 1  є спроможною оцінкою математичного очікування т генеральної сукупності.

приклад 39. Довести теорему про спроможність оцінки.

Доказ: для оцінки параметра ? може бути запропоновано декілька незміщене оцінок. Мірою точності несмещенной оцінки  вважають її дисперсію D [ ].

нехай и  - Дві різні незсунені оцінки параметра ?. якщо D [ ] ], то кажуть, що оцінка  більш ефективна, ніж оцінка .

У припущенні, що розподіл випадкової величини Х і статистика  задовольняють деяким умовам регулярності *), Для дисперсії несмещенной оцінки  параметра ? виконується нерівність Крамера - Рао:

 , де 1п (?) - інформація Фішера, що міститься у вибірці обсягу п щодо невідомого параметра ?. Для неперервної випадкової величини Х сплотностью розподілу fx(x, ?) .

Якщо ж Х- дискретна випадкова величина, то , де р (Х, ?) = Р [Х=х].

Умови регулярності (А*) Виконуються для звичайно використовуваних статистик нормального, біноміального і Пуассона-ського розподілів.

несмещенная оцінка  параметра ?, Дисперсія якої досягає свого найменшого можливого значення  , називається ефективною: .

несмещенная оцінка  називається асимптотично ефективної оцінкою параметра ?, якщо .

Якщо умови регулярності (А*) Не виконуються, то може існувати несмещенная оцінка параметра ?, дисперсія якої менше, ніж нижня межа в нерівності .

Така оцінка називається надефективну.

10.2. Метод максимальної правдоподібності

Метод максимальної правдоподібності є одним з найбільш поширених методів знаходження оцінок невідомих параметрів розподілу генеральної сукупності. нехай Х- безперервна випадкова величина з щільністю розподілу fx(x, ?), залежної від невідомого параметра ?, яку потрібно оцінити за вибіркою обсягу п. Щільність розподілу вибіркового вектора (Х1,Х2, ...,Хn) Можна записати у вигляді .

нехай х1,х2, ...,хn - Вибірка спостережень випадкової величини X, По якій знаходиться оцінка невідомого параметра.

Функцією правдоподібності L (?) вибірки обсягу п називається щільність вибіркового вектора, що розглядається при фіксованих значеннях змінних х1, ..., Хп. Функція правдоподібності є, таким чином, функцією тільки невідомого параметра ?, Тобто .

Аналогічно визначимо функцію правдоподібності вибірки дискретної випадкової величини X. нехай Х- дискретна випадкова величина, причому ймовірність Р [Х = х] = р (х, ?) є функція невідомого параметра ?. Припускаючи, що для оцінки параметра ? отримана конкретна вибірка спостережень випадкової величини X обсягу п: х1, ..., Хп. функція правдоподібності L (?) вибірки обсягу п дорівнює ймовірності того, що компоненти вибіркового вектора Х1, ..., Хn візьмуть фіксовані значення х1, ..., Хп, Тобто .

Метод максимальної правдоподібності полягає в тому, що в якості оцінки невідомого параметра ? приймається значення  , При якій досягається максимум функції правдоподібності. Таку оцінку називають МП - оцінкою. У разі дискретного розподілу спостережуваної випадкової величини X МП - оцінка невідомого параметра ? є таке значення  , При якому ймовірність появи даної конкретної вибірки максимальна. Аналогічну інтерпретацію МП - оцінки дають і в разі оцінки параметра розподілу неперервної випадкової величини.

Для спрощення обчислень, пов'язаних з отриманням МП -оценок, в деяких випадках зручно використовувати логарифмічну функцію правдоподібності, тобто ln L (?).

При виконанні деяких досить загальних умов МП - оцінки спроможні, асимптотично ефективні й асимптотично нормально розподілені. Останнє означає, що при збільшенні обсягу вибірки п для МП - оцінки  невідомого параметра ? виконується умова .

Якщо для параметра ? існує ефективна оцінка, то метод максимальної правдоподібності дає саме цю оцінку і інший МП - оцінки не існує.

Приклад 40.Знайти МП - оцінки математичного очікування т і дисперсії ?2 нормально розподіленої генеральної сукупності.

Рішення. нехай х1, х2, ..., Хп - Вибірка спостережень випадкової величини X з щільністю розподілу

.

Знайдемо функцію правдоподібності L (m, ?2). маємо

.

Логарифмічна функція правдоподібності звідси дорівнює

.

Використовуючи необхідні умови максимуму , отримаємо систему рівнянь для знаходження шуканих МП - оцінок:

,

.

З першого рівняння цієї системи знаходимо .

Підставляючи отримане значення в друге рівняння, матимемо .

Відзначимо, що вибіркове середнє  є несмещенной і заможної оцінкою т (Див. Приклад 38), а також ефективної оцінкою в разі нормально розподіленої генеральної сукупності (переконайтеся в цьому самостійно). вибіркова дисперсія  є спроможною і зміщеною оцінкою ?2.

Приклад 41.Знайти МП - оцінку параметра X розподілу Пуассона.

Рішення. нехай х1, ..., Хп - Вибірка спостережень випадкової величини X, має розподіл Пуассона з невідомим параметром X, Тобто

,

де х приймає невід'ємні цілочисельні значення, х = 0,1,2. функція правдоподібності L (?) вибірки обсягу п визначається так: .

Знайдемо логарифмічну функцію правдоподібності:

.

Використовуючи необхідна умова екстремуму, отримаємо рівняння для визначення МП-оцінки:

.

Звідси слідує що .

Отримана МП - оцінка є несмещенной і заможної оцінкою ? (Приклад 38), а також ефективної оцінкою цього параметра.

10.3. метод моментів

Для отримання оцінок невідомих параметрів ?1, ?2, ..., ?s розподілу генеральної сукупності X використовується і метод моментів. Пояснимо його.

нехай fх (х,?1, ?2, ..., ?s) - Щільність розподілу випадкової величини X. Визначимо за допомогою цієї щільності S будь-яких моментів випадкової величини X, наприклад, перші S початкових моментів, за формулами

, m = 1,2, ...,S.

За вибіркою спостережень випадкової величини знайдемо значення відповідних вибіркових моментів:

, m = 1,2, ...,S.

Попарно прирівнюючи теоретичні моменти ?т випадкової величини X їх вибірковими значеннями , отримуємо систему s рівнянь з невідомими ?1, ?2, ..., ?s:

, m = 1,2, ...,S.

Вирішуючи отриману систему відносно невідомих ?1, ?2, ..., ?s , знаходимо оцінки  невідомих параметрів.

Аналогічно знаходяться оцінки невідомих параметрів по вибірці спостережень випадкової величини.

приклад 42. Методом моментів знайти оцінки невідомих параметрів а и b для Г - розподілу з щільністю

.

Рішення. Для знаходження оцінок параметрів а и b за методом моментів скористаємося початковим моментом першого порядку (математичним очікуванням) і центральним моментом другого порядку (дисперсією):

, .

за вибіркою х1, ..., Хn з генеральної сукупності, що має Г-розподіл, знаходимо значення відповідних вибіркових моментів:

, .

Прирівнюючи відповідні рівності, отримуємо наступну систему рівнянь:

,  . Вирішуючи її, знаходимо , .

10.4. розподілу ?2, Стьюдента і Фішера.

Розподілу основних статистик, що обчислюються за вибіркою з нормально розподіленої генеральної сукупності, пов'язані з розподілами ?2 (K), Стьюдента Т (к) і Фішера F (k1, k2).

Квантилі цих розподілів наведені в додатку (таблиці П5, П6, П7). Дамо визначення і деякі властивості цих розподілів.

а) Розподілом ?2 з k ступенями свободи називається розподіл випадкової величини ?2 (K), Яка дорівнює сумі квадратів k незалежних нормально розподілених згідно із Законом N (0,1) випадкових величин Ui, I = 1,2, ...,k, Т. Е. Розподіл випадкової величини .

розподіл ?2 с k ступенями свободи там, де це не викликає непорозумінь, буде позначатися також ?2 (K).

щільність розподілу  визначається формулою

.

Графік функції  наведено на рис. 12. Середнє і дисперсія розподілу ?2 (K) дорівнюють відповідно: M [?2 (K)] = k, D [?2 (K)] = 2k.

Мал. 12.

розподіл ?2 часто використовується в статистичних розподілах. Розглянемо наступну теорему.

теорема 2. нехай х1, х2, ..., Хп - Вибірка з нормально розподіленої генеральної сукупності N (m, ?), a и  - Відповідно вибіркове середнє і вибіркова дисперсія. тоді статистики и S2 - Незалежні випадкові величини, причому статистика  має розподіл ?2 (n-1).

Зауважимо, що якщо ?2 (k1) і ?2 (k2) - Незалежні випадкові величини, що мають розподіл ?2 с k1 и k2ступенями свободи відповідно, то сума цих випадкових величин має розподіл ?2 с (k1, k2) ступенями свободи: ?2 (k1) + ?2 (k2) = ?2 (k1+k2).

розподіл ?2 (K) при великих значеннях k k> 30 з достатньою для практичних розрахунків точністю апроксимується нормальним розподілом.

Ця властивість використовується для наближеного виразу квантилів  розподілу ?2 (K) через квантилі ир нормального розподілу N (0,1). Зазвичай використовують наступні дві формули:

и .

Перша формула, яка застосовується при к?30 и р?0,5, дає відносну похибку в межах 1%, а друга формула застосовується для обчислення квантилів малого порядку.

приклад 43. обчислити квантилі , , .

Рішення. По таблиці додатків (П5) знаходимо  . Для обчислення квантилі  скористаємося першою формулою. Так як и0,95 = 1,645 (див. Таблицю додаток П1), то .

За другою формулою, використовуючи значення и0,01 = и0,99 = -2,326 Отримуємо .

б) Розподілом Ст'юдента з k ступенями свободи називається розподіл випадкової величини Т (k), рівній відношенню двох незалежних випадкових величин U и  , Т. Е.

,

де U має нормальний розподіл N (0,1). Розподіл Стьюдента з k ступенями свободи буде також позначатися Т (k). Розподіл Стьюдента з k ступенями свободи має щільність fT(X) (Рис. 13):

Мал. 13.

 , -? <x<+ ?,

середнє М [Т (к)] = 0 і дисперсію , к > 2.

Щільність розподілу Стьюдента симетрична щодо осі ординат, тоді для квантилів tp(K) має місце співвідношення tp(K) = - t1p(K).

при великих k (k> 30) для квантилів tp(K) розподілу Стьюдента виконано наближена рівність tp(К) ? ир. Більш точна формула має вигляд .

приклад 44. Знайти квантилі t0,05(8) і t0,90(40).

Рішення. По таблиці додатків (П6) знаходимо t0,95(8) = l, 86; t0,05(8) = -t0,95(8) = -l, 86. квантиль t0,90(40) визначимо, використовуючи записану вище формулу. Так як и0,90 = 1,28 за таблицею додатків (П1), то

Точне значення квантилі t0,90(40) по таблиці додатків (П6) одно 1,303.

в) Розподілом Фішера с k1 и k2 ступенями свободи називається розподіл випадкової величини F (k1, k2), Що дорівнює відношенню двох незалежних випадкових величин и  , тобто .

розподіл Фішера с k1 и k2 ступенями свободи позначається так: F (k1, k2). розподіл Фішера с k1 и k2 ступенями свободи має щільність fF(X) (Рис. 14):

Мал. 14.

.

середнє , .

Квантилі розподілу Фішера порядку р і 1 - р пов'язані між собою так: .

Між випадковими величинами, що мають нормальний розподіл, розподілу ?2 Стьюдента і Фішера, мають місце співвідношення: Т2(K) = F (1, K), и .

при k1 > 1 і k2 > 1 квантилі розподілу Фішера можна обчислити, використовуючи наближену формулу

.

приклад 45. Знайти такі квантилі F0,01(3,5), F0,90(4,100) і F0,05(60,120).

Рішення. Використовуючи відоме співвідношення і таблицю додатків (П7), отримуємо .

далі знаходимо .

Далі знаходимо, використовуючи значення u0,05 = -u0,95 = -1,645, .

По таблиці додатків (П7) значення квантилі F0,05(60,120) одно .

 



Попередня   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23   Наступна

Теореми множення ймовірностей подій | Теорема множення ймовірностей n подій | Теорема множення ймовірностей n незалежних подій | Формула повної ймовірності | формули Бейеса | повторення випробувань | Основні формули | Випадкові величини: дискретні і безперервні | Основні формули для обчислення числових характеристик | I. Приклади деяких розподілів дискретних випадкових величин |

загрузка...
© um.co.ua - учбові матеріали та реферати