загрузка...
загрузка...
На головну

Методи статистичного опису результатів спостережень

  1. I. 2.4. Принципи та методи дослідження сучасної психології
  2. I. Методи перехоплення.
  3. I. Суб'єктивні методи дослідження ендокринної системи.
  4. I.Суб'ектівние методи дослідження кровотворної системи.
  5. I.Суб'ектівние методи дослідження органів жовчовиділення і підшлункової залози.
  6. I.Суб'ектівние методи дослідження органів сечовиділення.
  7. II. Методи несанкціонованого доступу.

9.1. Основні задачі математичної статистики

Встановлення закономірностей, яким підпорядковані масові випадкові явища, засноване на вивченні методами теорії ймовірностей статистичних даних - результатів спостережень.

Перше завдання математичної статистики - вказати способи збору і угруповання статистичних відомостей, отриманих в результаті спостережень або в результаті спеціально поставлених експериментів.

Друге завдання математичної статистики - розробити методи аналізу статистичних даних в залежності від цілей дослідження. тут:

а) оцінка невідомої ймовірності події; оцінка параметрів розподілу, вид якого відомий; оцінка залежності випадкової величини та ін .;

б) перевірка статистичних гіпотез про вид невідомого розподілу або про величину параметрів розподілу, вид якого відомий.

Сучасна математична статистика розробляє способи визначення числа необхідних випробувань до початку дослідження (планування експерименту), в ході дослідження (послідовний аналіз), і вирішує багато завдань. Математична статистика визначається як наука про прийняття рішень в умовах невизначеності.

Завдання математичної статистики допомагають створювати методи збору та обробки статистичних даних для отримання наукових і практичних висновків.

9.2. Вибірка, способи її подання.

Математична статистика дозволяє отримувати обгрунтовані висновки про параметри, видах розподілів і інших властивостях випадкових величин по кінцевої сукупності спостережень над ними - вибірці.
У практиці статистичних спостережень розрізняють два види спостережень: суцільне (вивчаються всі об'єкти сукупності) і несуцільну, вибіркове (вивчається частина об'єктів).
 Вся підлягає вивченню сукупність об'єктів (спостережень) називається генеральною сукупністю.

Поняття генеральної сукупності в певному сенсі аналогічно поняттю випадкової величини (закону розподілу ймовірностей, імовірнісного простору), так як повністю обумовлено певним комплексом умов.

Частина об'єктів, відібрана для безпосереднього ізученіяіз генеральної сукупності, називається вибірковою сукупністю, або вибіркою. Числа об'єктів (спостережень) в генеральній або вибіркової сукупності називаються їх обсягами. Генеральна сукупність може мати як кінцевий, так і нескінченний об'єм.

Сутність вибіркового методу полягає в тому, щоб за деякою частини генеральної сукупності (за вибіркою) виносити судження про її властивості в цілому.

Перевага вибіркового методу в порівнянні з суцільним полягає в наступному:
 - Дозволяє економити витрати ресурсів;

- Є єдино можливим в разі нескінченної генеральної сукупності або в разі, коли дослідження пов'язане з знищенням спостережуваних об'єктів;

- Дає можливість поглибленого дослідження за рахунок розширення програми дослідження;

- Дозволяє знизити помилки реєстрації, тобто розбіжність між істинним і зареєстрованим значеннями ознаки.

 Основний недолік вибіркового методу - помилки дослідження, звані помилками репрезентативності (представництва).

Розрізняють такі види вибірок:

- Власне-випадкова вибірка, утворена випадковим вибором елементів без розчленування на частини або групи;

- Механічна вибірка, в неї елементи з генеральної сукупності відбираються через певний інтервал;

- Типова (стратифікована) вибірка, в яку випадковим чином відбираються елементи з типових груп;

- Серійна (гніздовий) вибірка, в яку випадковим чином відбираються не елемент, а цілі групи сукупності, причому самі серії піддаються суцільному спостереженню.

Використовують два способи освіти вибірки:

- Повторний відбір (за схемою повернутого кулі), коли кожен елемент, випадково відібраний і обстежений, повертається в загальну сукупність і може бути повторно відібраний;

- Бесповторний відбір (за схемою неповерненого кулі), коли відібраний елемент не повертається загальну сукупність.

Отже, закон розподілу деякої випадкової величини X називається розподілом генеральної сукупності, а випадковий вектор (X1, ..., Xn) - Вибірковим вектором. числа х1, ..., хп, одержувані на практиці при n-кратноє повторенні деякого експерименту в незмінних умовах, являють собою реалізацію вибіркового вектора і є вибірка 1, х2, ..., Хп) обсягу п.

вибірку 1, х2, ..., Хп) при необхідності можна розглядати як точку вибіркового простору, т. е. безлічі, на якому задано розподіл вибіркового вектора (Х1, Х2, ..., Хn).

Аналогічно визначається вибірка в разі, коли деякий випадковий експеримент пов'язаний з декількома випадковими величинами. Так, вибірка обсягу п з двовимірної генеральної сукупності є послідовність (х1,у1), ..., (хn, уn) пар значень випадкових величин X и Y, прийнятих ними в п незалежних повторах деякого випадкового експерименту.

варіаційним рядом вибірки х1, х2, ..., Хп називається спосіб її записи, при якому елементи упорядковуються по величині, т е. записуються в вигляді послідовності х(1), х(2), ..., х(n), де х(1)(2)? ... ?х(n).

Різниця між максимальним і мінімальним елементами вибірки x(max) -x(min) = ?називается розмахом вибірки. нехай вибірка 1, х2, ..., Хп) містить k різних чисел z1, z2, ..., Zk , причому zi зустрічається ni раз (i = 1,2, ..., K ). число ni називають частотою елемента вибірки zi. Слід зауважити, що .

статистичним рядом називають послідовність пар (zi, ni). Статистичний ряд записують у вигляді таблиці, в першому рядку якої знаходяться елементи zi, А в другій - їх частоти.

приклад 28. Записати у вигляді варіаційного і статистичного рядів вибірку 5, 3, 7, 10, 5, 5, 2, 10, 7, 2, 7, 7, 4, 2, 4. Визначити розмах вибірки.

Рішення. В даному випадку обсяг вибірки n = 15. Впорядкуємо елементи вибірки за величиною, отримаємо варіаційний ряд 2, 2, 3, 4, 4, 5, 5, 5, 7, 7, 7, 7, 10, 10. Знайдемо розмах вибірки ? = 10-2 = 8 . Різними в заданій вибірці є елементи z1 = 2, z2 = 3, z3 = 4, z4 = 5, z5 = 7, z6 = 10; їх частоти відповідно рівні n1 = 3, n2= 1, n3 = 2, n4 = 3, n5 = 4, n6 = 2. Статистичний ряд вихідної вибірки можна записати у вигляді такої таблиці:

zi
ni

Для контролю правильності запису знаходимо  . При великому обсязі вибірки її елементи рекомендується об'єднувати в групи (розряди), представляючи результати дослідів у вигляді асоційованого статистичного ряду. У цьому випадку інтервал, що містить всі елементи вибірки, розбивається на k непересічних інтервалів. Обчислення спрощуються, якщо ці інтервали мають однакову довжину  . Надалі розглядається саме цей випадок. Після того як часткові інтервали обрані, визначають частоти - кількість ni елементів вибірки, що потрапили в i-й інтервал (елемент, що співпадає з верхньою межею інтервалу, відноситься до наступного інтервалу). Добутий статистичний ряд у верхньому рядку містить середини zi інтервалів угруповання, а в нижній - частоти ni (i = 1,2, ...,k).

Поряд з частотами одночасно підраховуються також накопичені частоти  , Відносні частоти ni / п и накопичені відносні частоти , i = 1,2, ...,k. Отримані результати зводяться в таблицю, яка називається таблицею частот асоційованої вибірки.

Слід пам'ятати, що угруповання вибірки вносить похибка в подальші обчислення, яка росте зі зменшенням числа інтервалів.

Приклад 29.Уявити вибірку 55 спостережень у вигляді таблиці частот, розбивши наявні дані вибірки на сім інтервалів угруповання. вибірка:

 20,3  15,4  17,2  19,2  23,3  18,1  21,9
 15,3  16,8  13,2  20,4  16,5  19,7  20,5
 14,3  20,1  16,8  14,7  20,8  19,5  15,3
 19,3  17,8  16,2  15,7  22,8  21,9  12,5
 10,1  21,1  18,3  14,7  14,5  18,1  18,4
 13,9  19,1  18,5  20,2  23,8  16,7  20,4
 19,5  17,2  19,6  17,8  21,3  17,5  19,4
 17,8  13,5  17,8  11,8  18,6  19,1  

В даному випадку розмах вибірки ?= 23,8 -10,1 = 13,7; тоді довжина інтервалу угруповання буде b = 13,7 / 7?2. В якості першого інтервалу візьмемо інтервал 10 - 12. Результати угруповання зведемо в таблицю 1

Таблиця 1

 номер інтервалу i  межі інтервалу  середина інтервалуzi  частотаni  накопичена частота  відносна частотаni / п  Накопленнаяотносітельнаячастота
 10-12 2  0,0364  0 0364
 12-14  0,0727  0 тисяча дев'яносто один
 14-16  0,1455  0 2546
 16-18  0,2182  0,4728
 18-20  0,2909  0 7637
 20-22  0,1818  0,9455
 22-24  0,0545  1,0000

9.3. функція розподілу.

нехай 1, х2, ..., Хп) - Вибірка з генеральної сукупності з функцією розподілу Fx(X) . Розподілом вибірки називається розподіл дискретної випадкової величини, що приймає значення х1, х2, ..., Хп з вірогідністю 1 /n. Відповідну функцію розподілу називають емпіричною (вибіркової) функцією розподілу і позначають .

Емпіричну функцію розподілу визначимо за значеннями накопичених частот співвідношенням  , Тут підсумовуються частоти тих елементів вибірки, для яких виконується нерівність zi < х . Тоді отримаємо, що  при х?х(1) и  при х> х(n). На проміжку (х(1); х(n)]  є неубутних кусочно-постійну функцію.

Аналогічно визначаємо емпіричну функцію розподілу для асоційованої вибірки.

Значення емпіричної функції розподілу для статистики визначається наступним затвердженням.

теорема(Гливенко). нехай  - Емпірична функція розподілу, побудована за вибіркою обсягу п з генеральної сукупності з функцією розподілу Fx(X). Тоді для будь-якого х I (- ?, + ?) і будь-якого ?> 0

.

Таким чином, при кожному х  сходиться по ймовірності до Fx(X) і при великому обсязі вибірки може служити наближеним значенням (оцінкою) функції розподілу генеральної сукупності в кожній точці х.

9.4. Гістограма і полігон.

Для наочного уявлення вибірки можна використовувати гістограму і полігон частот.

гістограмою частот асоційованої вибірки називається кусочно-постійна функція, постійна на інтервалах угруповання і приймаюча на кожному з них значення ,

i = 1,2, ...,k відповідно. Площа ступінчастою фігури під графіком гістограми дорівнює обсягу вибірки п.

аналогічно визначається гістограма відносних частот. Площа відповідної ступінчастою фігури для неї дорівнює одиниці.

При збільшенні обсягу вибірки і зменшенні інтервалу угруповання гістограма відносних частот є статистичним аналогом щільності розподілу fx(X) генеральної сукупності.

полігоном частот називається ламана з вершинами в точках , де i = 1,2, ...,k , а полігоном відносних частот - ламана з вершинами в точках  , де i = 1,2, ...,k. Маємо, що полігон відносних частот виходить з полігону частот стисненням по осі Оу в п раз.

Якщо щільність розподілу генеральної сукупності є досить гладкою функцією, то полігон відносних частот є більш хорошим наближенням щільності, ніж гістограма.

приклад 30. Побудувати гістограму та полігон частот, а також графік емпіричної функції розподілу асоційованої вибірки з прикладу 29.

Рішення. За результатами угруповання (див. Таблицю 1.) будуємо гістограму частот (рис. 7). Поєднуючи відрізками ламаної середини верхніх підстав прямокутників, з яких складається отримана гістограма, отримуємо відповідний полігон частот (рис. 8).

 Так як середина першого інтервалу угруповання z1 = 11, то  при х ? 11. Міркуючи аналогічно, знаходимо, що  при х> 23. На полуінтервале (11,23] емпіричну функцію розподілу будуємо за даними третього і останнього стовпців таблиці 1.

рис.7 Рис.8

 має скачки в точках, відповідних серединам інтервалів угруповання. В результаті отримуємо графік , зображений на рис. 9.

рис.9

9.5. Метод моделювання.

У завданнях статистичного аналізу складних систем, наприклад, при розробці систем автоматичного проектування (САПР), широко використовується метод моделювання вибірки з генеральної сукупності з заданим законом розподілу.

Нехай випадкова величина X має функцію розподілу Fx (X). Як відомо з теорії ймовірностей випадкова величина Y = Fx(X) має рівномірний розподіл R(0, l). Звідси випливає, що випадкова величина X може бути отримана з рівномірно розподіленої випадкової величини Y за формулою  , де  - Функція, обернена до Fx (Свідомо існуюча для випадкових величин безперервного типу).

Метод моделювання вибірки з генеральної сукупності з законом розподілу Fx(X) реалізується наступним алгоритмом: , j = 1,2, ...,n, де у1,у2, ...,уn - Вибірка з

генеральної сукупності з рівномірним розподілом R(0,1), що є послідовністю випадкових чисел.

випадкові числа у1,у2, ...,уn можна отримати, вибравши випадковим чином n чисел з табліци- додатків П12 (див. в кінці навчального посібника) і розділивши кожне вбрання число на 100. При наявності будь-якого обчислювального пристрою випадкові числа у1,у2, ...,уn генеруються за допомогою формули , jIN, де {А} - дробова частина числа a, am- просте число, більше десяти. В якості початкового значення у1 в записаної вище формулою можна вибрати довільне число з інтервалу (0, l) з ненульовими розрядами в десятковій системі числення. Від вдалого вибору початкового значення ух залежить якість послідовності у1,у2, ...,уn.

Цей алгоритм отримання вибірки з генеральної сукупності з законом розподілу Fx(X) пояснюється на рис. 10.

Мал. 10.

Для отримання вибірки з генеральної сукупності, розподіленої за законом N(0,1), можна скористатися алгоритмом, заснованим на будь-якому з наступних співвідношень:

, j = 2,3, ...,n,

,

де, як і вище, у1, у2, ..., Уп - Вибірка з генеральної сукупності з рівномірним розподілом R(0,1).

9.6. Числові характеристики вибіркового розподілу.

нехай х1, х2, ..., Хп -виборка обсягу п з генеральної сукупності з функцією розподілу Fx(X). Розглянемо вибіркове розподіл, т. Е. Розподіл дискретної випадкової величини, що приймає значення х1, х2, ..., Хп з вірогідністю, рівними 1/ П. Числові характеристики цього вибіркового розподілу називаються вибірковими (емпіричними) числовими характеристиками. Слід зазначити, що вибіркові числові характеристики є характеристиками даної вибірки, але не є характеристиками розподілу генеральної сукупності. Щоб підкреслити цю відмінність, вибіркові характеристики надалі будемо позначати тими ж символами, що і випадкові величини, але з позначкою * нагорі. Деякі вибіркові характеристики мають традиційні позначення, наприклад,  - Вибіркове середнє.

приклад 31. Знайти формули, що визначають вибіркові математичне сподівання і дисперсію для негруппірованной вибірки обсягу п.

Рішення. Математичне сподівання дискретної випадкової величини визначається за формулою

.

Так як для вибіркового розподілу рj = 1 /n, то .

Аналогічно матимемо вибіркову дисперсію .

вибіркової модою  унімодального (одновершинная) розподілу називається елемент вибірки, що зустрічається з найбільшою частотою.

вибіркової медианой називається число , яке ділить варіаційний ряд на дві частини, що містять рівне число елементів.

Якщо обсяг вибірки п - непарне число (тобто п = 2l +1), То  , Тобто є елементом варіаційного ряду із середнім номером. Якщо ж п = 2l, то .

приклад 32. Визначити середнє, моду і медіану для вибірки 5, 6, 8, 2, 3, 1, 1, 4.

Рішення. Уявімо дані у вигляді варіаційного ряду: 1, 1, 2, 3, 4, 5, 6,8. вибіркове середнє  . Всі елементи входять до вибірки по одному разу, крім 1, отже, мода  . Так як п = 8, то медіана .

Отже, , , .

Для спрощення обчислень вибіркових середнього і дисперсії асоційованої вибірки, цю вибірку перетворять так: , I = 1,2, ...,k , де - вибіркова мода, а b - Довжина інтервалу угруповання. Ці співвідношення показують, що до вибірки z1 , z2, ..., Zn внесена систематична помилка  , А результат підданий перетворення масштабу з коефіцієнтом k = 1 / b. Отриманий в результаті набір чисел u1 , u2, ..., Un можна розглядати як вибірку з генеральної сукупності . Тоді вибіркові середнє  і дисперсія  вихідних даних пов'язані із середнім  і дисперсією  перетворених даних наступними співвідношеннями: , .

приклад 33. Обчислити середнє і дисперсію асоційованої вибірки

 межі інтервалів  134-138  138-142  142-146  146-150  150-154  154-158
 частоти

Рішення. Довжина інтервалу угруповання b = 4, значення середини інтервалу, що зустрічається з найбільшою частотою  . Перетворення послідовності середин інтервалів виконується за формулою:

 , де i = 1,2, ..., 6.

Таблиця 2

i zi ui ni ni ui ni ui2 ni (ui +1)2
 -3  -3
 -2  -6
 -1  -15
- -  -6

Обчислення зведені в таблицю 2. Останній стовпець цієї таблиці служить для контролю обчислень за допомогою тотожності .

Виконуючи обчислення, отримаємо 58 + 2 · (-6) + 23 = 99.

Отриманий результат показує, що обчислення виконані правильно. За формулами, даним вище, знаходимо середні значення U

, .

Далі знаходимо середні даної вибірки:

, .

9.7. Вибіркові коефіцієнти асиметрії, ексцесу. Квантиль.

Вибіркові коефіцієнти асиметрії та ексцесу обчислюються за формулами , .

Обчислення вибіркових коефіцієнтів асиметрії та ексцесу для асоційованої вибірки значно спрощується, якщо дані попередньо перетворити. При цьому використовують такі формули:

,

.

Для контролю підрахунку сум , l = 1,2,3,4 обчислюють окремо праву і ліву частини тотожності . Результати обчислень слід оформити у вигляді таблиці.

Перейдемо до розгляду поняття вибіркової квантилі. нехай х(1), ...,х(n) - Варіаційний ряд вибірки обсягу п. якщо пр - Не ціла кількість, то вибіркової квантиль  порядку р (0 < р < 1) називається k - Перший член варіаційного ряду, де k = [Пр] +1. Якщо ж пр - Ціле число, то відповідна квантиль  не визначена (вона може приймати будь-яке значення з інтервалу [x(k), х(k+1)).

Приклад 34.Обчислити середнє, дисперсію, коефіцієнти асиметрії та ексцесу для наступної асоційованої вибірки:

 межі інтервалів  10-12  12-14  14-16  16-18  18-20  20-22  22-24
 частоти

Довжина інтервалу угруповання b = 2. Значення zi , Що зустрічається з найбільшою частотою,  . Тому перетворення має вигляд  , де i = 1,2, ..., 7.

Всі обчислення оформимо у вигляді таблиці 3.

Таблиця 3

i zi ui ni ni ui ui2 ni ui2 ui3 ni ui3 ui4 ni ui4 ui +1 (ui +1)4 ni (ui +1)4
 -4  -8  -64  -128  -3
 -3  -12  -27  -108  -2
 -2  -16  -8  -64  -1
 -1  -12  -1  -12
- -  -32 - -  -278 - - -
  -  -0,582 -  2,436 -  -5,054 -  18,8 - - -

Контроль обчислень буде 54 + 4 · (-32) + 6 · 134 + 4 · (-278) + 1034 = 653.

Знаходимо шукані характеристики вибіркового розподілу:

,

, , ,

.

9.8. Двовимірний випадковий вектор, його статистичний опис

і вибіркові характеристики.

нехай (хi,уi), i= 1,2, ...,n - Вибірка обсягу і з спостережень випадкового двовимірного вектора (X,Y). Попереднє подання про двовимірної генеральної сукупності можна отримати, зображуючи елементи вибірки точками на площині з обраної декартовій прямокутній системою координат. Це уявлення вибірки називається діаграмою розсіювання.

Розподілом двовимірної вибірки називається розподіл двовимірного дискретного випадкового вектора, що приймає значення (хi,уi), i= 1,2, ...,n, З вірогідністю, рівними 1 /n. Вибіркові числові характеристики обчислюються як відповідні числові характеристики двовимірного випадкового вектора дискретного типу.

приклад 35. Знайти вибіркові середні, дисперсії і коефіцієнт кореляції для вибірки, наведеної в таблиці. Побудувати діаграму розсіювання.

Рішення. Обчислення зазначених вибіркових характеристик зручно виконувати в наступній послідовності. Спочатку обчислюють суми , , , , ,  .Для Контролю правильності обчислень використовується тотожність

.

Таблиця 4

x y x y x y x y x y
 8,35  3,50  10,50  6,00  11,35  9,50  12,15  6,00  12,85  9,50
 8,74  1,49  10,75  2,50  11,50  6,00  12,25  8,05  13,15  9,02
 9,25  6,40  10,76  5,74  11,50  9,00  12,35  5,01  13,25  6,49
 9,50  4,50  11,00  8,50  11,62  8,50  12,50  7,03  13,26  10,50
 9,75  5,00  11,00  5,26  11,75  10,00  12,76  7,53  13,40  7,51
 10,24  7,00  11,25  8,00  12,00  9,00  12,85  6,01  13,50  10,00
 13,65  9,50  14,50  10,00  13,75  8,51  14,75  12,00  14,00  11,00
 15,25  12,50  14,23  8,40  16,00  11,50  14,26  10,00  16,00  13,00
 14,51  9,50  16,25  12,00            

обсяг вибірки п = 42.

Вибіркові середні звідси знаходяться за формулами

,

Потім обчислюються суми квадратів відхилень від середнього і творів відхилень від середніх: , ,

Звідси , , .

попередньо обчислимо

, , , , .

тоді знайдемо , .

далі знаходимо , , .

Остаточно, отримуємо

, , .

 Діаграма розсіювання приведена на рис. 11.

Мал. 11.

Вибіркова лінійна регресія Y на X за вибіркою (хi,уi), i= 1,2, ...,n, Визначається рівнянням

.

коефіцієнти и  називаються вибірковими коефіцієнтами регресії. Вони обчислюються за формулами: , .

Аналогічно визначається вибіркова лінійна регресія X на Y:  коефіцієнти и  якої знаходяться за формулами

, .

Для контролю правильності розрахунків використовують співвідношення .

прямі ,  перетинаються в точці з координатами .

Приклад 36.Обчислити вибіркові коефіцієнти лінійної регресії X на Y и Y на X за вибіркою прикладу 35. Нанести прямі регресії на діаграму розсіювання.

Рішення. Скористаємося результатами обчислень в прикладі 35. За формулами знаходимо

, .

Таким чином, пряма регресії Y на X має рівняння y= -5,705 + 1,103x.

аналогічно знаходимо , .

Звідси пряма регресії X на Y має рівняння х = 7,637 + 0,599у.

Перевірка показує  , Що отриманий результат збігається зі значенням r, обчисленим в прикладі 35. Прямі регресії нанесені на діаграму розсіювання на рис.11.

9.9. кореляційний таблиця

.

двовимірну вибірку великого обсягу подають як кореляційної таблиці. З цією метою групують реалізації величин X и Y по інтервалах довжини bх и by, А в клітини таблиці

записують число пар вихідної вибірки (т. е. частоти) для кожної комбінації інтервалів. Цю процедуру можна також виконати безпосередньо по діаграмі розсіювання, завдаючи на неї сітку горизонтальних і вертикальних прямих, взятих з постійними кроками bх и by. Спостереження, які потрапили на верхню і праву кордону розглянутого прямокутника, відносяться відповідно до сусідніх верхньому і правому прямокутникам. У подальших обчисленнях використовуються середини інтервалів і відповідні частоти. Позначимо середини інтервалів через , i= 1,2, ...,k и , j= 1,2, ...,l, А відповідні частоти через nij; очевидно, .

вважаємо , .

Для спрощення обчислень замість середин інтервалів и  введемо числа , i= 1,2, ...,k, , j= 1,2, ...,l, де и  - Середини найбільш часто зустрічаються інтервалів.

Визначення вибіркових числових характеристик розподілу по кореляційної таблиці виконується в наступній послідовності. Спочатку обчислюють суми

, , , , .

Потім визначають наступні суми:

, , .

Вибіркові середні, дисперсії і коефіцієнт кореляції знаходять за формулами , , , , .

коефіцієнти и  лінійної регресії Y на X и X на Y обчислюють за формулами ,  . коефіцієнти и  знаходять за відповідними формулами.

Приклад 37.Використовуючи угруповання вибірки, заданої таблицею 4 в прикладі 35, обчислити вибіркові середні, дисперсії, коефіцієнт кореляції, а також вибіркові коефіцієнти лінійної регресії Х на Y и Y на Х.

Рішення. виберемо bx=1, by=2. Прямокутна сітка, що відповідає цим значенням, нанесена на діаграму розсіювання (рис. 11). Безпосередньо по діаграмі будуємо кореляційну таблицю (таблиця 5). знаходимо ,  і обчислюємо значення ui и vj за формулами , i= 1,2, ..., 9, , j= 1,2, ..., 7.

Обчислюємо наступні суми:

, , , ,  . За формулами знаходимо , ,  . далі отримуємо , , , ,  . Знаходимо вибіркові коефіцієнти регресії: , , , .

Остаточно отримаємо, що рівняння лінійної регресії Y на X має вигляд у = -5,74 + 1,12x, А рівняння лінійної регресії X на Y має вигляд x = 7,72 + 0,58y.

Розбіжність отриманих результатів з результатами вище розглянутих прикладів обумовлено угрупованням.

Таблиця 5.

Кореляційний таблиця для діаграми розсіювання наприклад 37.

 Межі і середини інтервалів для y vj  Межі і середини інтервалів для x nj njvj njvj2
 8-98,5  9-109,5  10-1110,5  11-1211,5  12-1312,5  13-1413,5  14-1514,5  15-1615,5  16-1716,5
ui
 -3  -2  -1
 0-2  -4  -4
 2-4  -3  -6
 4-6  -2  -10
 6-8  -1  -10
 8-10
 10-12
 12-14
ni  ? = 42  ? = -15  ? = 87
nivi  -6  -6  -4  ? = 43  
nivi2  ? = 215

 



Попередня   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   Наступна

Теорема додавання ймовірностей n несумісних подій | Теореми множення ймовірностей подій | Теорема множення ймовірностей n подій | Теорема множення ймовірностей n незалежних подій | Формула повної ймовірності | формули Бейеса | повторення випробувань | Основні формули | Випадкові величини: дискретні і безперервні | Основні формули для обчислення числових характеристик |

загрузка...
© um.co.ua - учбові матеріали та реферати