На головну

Варіаційні ряди та їх графічна інтерпретація

  1.  III. Варіаційні ряди, середні величини
  2.  Аналіз і інтерпретація даних.
  3.  Археологіяли? матеріалдарди? м?деніеттанули? інтерпретаціяси
  4.  Асиметрія неперервної випадкової величини, її геометрична інтерпретація
  5.  Квиток №19. Бюджетне обмеження споживача: економічний сенс, алгебраїчна та графічна інтерпретація
  6.  Квиток №28. Оптимум виробника. Економічний сенс. Аналітична та графічна інтерпретація
  7.  Біографічна орієнтація

Елементи математичної статистики

Математична статистика - Це наука, що займається отриманням, описом і обробкою досвідчених даних або спостережень з метою вивчення закономірностей масових явищ.

Варіаційні ряди та їх графічна інтерпретація

У практиці статистичних спостережень розрізняють два види спостережень: суцільне, Коли вивчаються всі об'єкти (елементи) і вибіркове, Коли вивчається частина об'єктів. Вся вивчається сукупність об'єктів називається «Генеральною сукупністю». Найпростіший приклад генеральної сукупності - матеріали перепису населення тієї чи іншої країни, в яких є відомості про всіх її громадян. Поняття генеральної сукупності аналогічно поняттю всієї сукупності значень випадкової величини.

Як правило, для обробки спостережень або досвіду вдається використовувати тільки частина генеральної сукупності - так звану «Вибіркову сукупність» або «Вибірку».

Сутність вибіркового методу в статистиці полягає в тому, щоб за властивостями вибірки зробити висновок про властивості всієї генеральної сукупності.

На початковому етапі дані вибірки заносяться в таблицю, де записуються номери і результати вимірювань або опитувань. Різні значення випадкової величини, що спостерігаються в результаті експерименту, називаються варіантами (позначаються через x). У таблиці варіанти розташовуються в порядку їх зростання.

Приклад. Генеральна сукупність - N ящиків з приладами;

вибіркова сукупність - N = 10 обраних для контролю ящиків.

Підраховується число постраждалих при транспортуванні ящиків деталей. Результати підрахунку представлені в таблиці:

 № ящ.
 Кол. д.

Якщо кількість постраждалих деталей - це досліджувана випадкова величина X, то отримані дані про неї можна представити у вигляді «статистичного ряду розподілу»:

Х
 0,2  0,3  0,2  0,1  0,1  0,1

Тут, як для будь-якої випадкової величини, перераховані всі можливі значення, що приймаються величиною Х, але замість ймовірностей цих значень у другому рядку записані їхні відносні частоти  . Наприклад, постраждалих деталей немає тільки в двох ящиках (в першому і дев'ятому) з десяти, тому и  . Зауважимо, що замість відносних частот можна використовувати також число  , Яке показує, скільки разів дана варіанта зустрічається у вибірці; це число називають частотою варіанти.

Розташований в порядку зростання (або зменшення) ряд варіант з відповідними їм частотами або відносними частотами називається варіаційним рядом.

Можливий і інший спосіб опису статистичних даних. Нехай ми знову маємо «статистичний ряд», але досить довгий. Щоб зробити результати досвіду більш доступним для огляду, весь діапазон спостережених значень величини  розіб'ємо на розряди (інтервали) і підрахуємо частоту потрапляння значень  до відповідного інтервал. Розглянемо знову наш приклад.

 Інтервал значень Х 0  Х <2 2 Х 3 3 Х 5
 Частота попадань в інтервал  5 (0,5)  2 (0,2)  2 (0,2)

У дужках вказані відносні частоти.

При складанні варіаційного ряду по інтервалах слід мати на увазі, що число інтервалів  слід брати не дуже великим, щоб після угруповання ряд не був громіздким, і не дуже малим, щоб не втратити особливості розподілу ознаки. Всі інтервали бажано вибирати однакової довжини, при цьому початок інтервалу включається в нього, а кінець - немає. згідно формулою Стерджеса рекомендований число інтервалів ,а величина (шірінаінтервала) , де  - Різниця між найбільшим і найменшим значеннями ознаки.

При вивченні варіаційних рядів поряд з поняттям частоти використовується поняття накопиченої частоти (позначення  ). Накопичена частота показує, скільки спостерігалося варіантів зі значенням ознаки, меншим  . Ставлення накопиченої частоти  до загальної кількості спостережень  називають накопиченої частоти .

Накопичені частоти для кожного інтервалу знаходяться послідовним підсумовуванням частот всіх попередніх інтервалів, включаючи даний.

Для графічного зображення варіаційних рядів використовуються два види графіків: полігончастот або відносних частот і гістограма.

Полігон частот (відносних частот) являє собою ламану, відрізки якої з'єднують точки з координатами  (Або координатами (  )), Де  -Значення досліджуваної випадкової величини.

 Для розглянутого вище варіаційного ряду полігон відносних частот має наступний вигляд:

 
 


 
 

 Полігон частот є аналогом багатокутника розподілів дискретної випадкової величини.

гістограми служать тільки для зображення інтервальних варіаційних рядів.

гістограмою частот називають ступінчасту фігуру, що складається з прямокутників, підставами яких служать інтервали  значень ознаки, а висоти дорівнюють відношенню  (Тобто визначаються кількістю значень вимірюваної величини, що потрапляють в відповідний інтервал). Площа i-го прямокутника дорівнює  - Сумі частот варіант, які потрапили в i-й інтервал.

Гістограмою відносних частот називають ступінчасту фігуру, що складається з прямокутників, підставами яких служать інтервали  значень ознаки, а висоти дорівнюють відношенню  . Площа i-го прямокутника дорівнює  - Відносної частоті варіант, що потрапили в i-й інтервал.

 
 

 Гістограма нашого інтервального варіаційного ряду зображена нижче.

Якщо з'єднати середини верхніх підстав прямокутників відрізками, то вийде полігон того ж розподілу.

Ще одним важливим поняттям служить поняття емпіричної функції розподілу.

Емпіричної функцією розподілу називається відносна частота того, що ознака (випадкова величина  ) Прийме значення, менше заданого  , тобто

.

Згідно з цим визначенням, для даного  емпірична функція розподілу являє накопичену частость :

.

6.2. Кількісні характеристики варіаційного ряду

1. Середня арифметична обчислюється за формулою

,

де  - Варіанти ряду,  - Відповідні їм частоти або середини відрізків інтервалів інтервального варіаційного ряду,  - Число неповторюваних варіант або число інтервалів, .

Для несгруппірованних ряду всі частоти (  ), А  є «невиважена» середня арифметична.

2. Средняя геометрична .

Ці середні величини називають аналітичними. У статистичному аналізі використовуються також структурні або порядкові середні. З них найбільш широко використовуються медіана і мода

3. медіана - це варіанти (значення величини, ознаки), що припадає на середину рангового ряду спостережень.

Для дискретного варіаційного ряду з непарним числом членів медіана дорівнює серединної варіанті, а для ряду з парним числом членів - полусумме двох серединних варіант.

Гідність медіани як заходи центральної тенденції полягає в тому, що на неї не впливає зміна крайніх членів варіаційного ряду. Медіана краще середньої арифметичної для ряду, у якого крайні варіанти в порівнянні з іншими виявилися надмірно великими або малими.

4. Мода варіаційного ряду - це варіанти, якій відповідає найбільша частота.

Особливість моди як заходи центральної тенденції полягає в тому, що вона не змінюється при зміні крайніх членів ряду, т. Е. Має певну стійкість до варіації ознаки.

Середні величини, розглянуті вище, не відображають мінливості (варіації) значень ознаки.

К показниками варіаціївідносяться такі характеристики.

5. варіаційний розмах - різницю між найбільшою і найменшою варіантами ряду:

.

6. Середнє лінійне відхилення - Це середня арифметична абсолютних величин відхилень варіант від їх середньої арифметичної:

7. дисперсія варіаційного ряду - це середня арифметична квадратів відхилень варіант від їх середньої арифметичної:

.

дисперсію часто називають емпіричної (або вибіркової), Підкреслюючи, що вона знаходиться за дослідними або статистичними даними.

8. Середнє квадратичне відхилення  - Це арифметичне значення кореня квадратного з дисперсії:

.

Обчислення середньої арифметичної  і дисперсії  можна спростити, якщо використовувати не початкові варіанти  , А нові (позначимо їх через  ): .

В останній формулі и  - Спеціально підібрані постійні.

Середня арифметична варіаційного ряду  , Що складається з варіант  , Відповідно до властивостями середньої арифметичної, обчислюється за формулою:

.

Позначимо дисперсію цього ряду символом  . Тоді з властивостей дисперсії випадкової величини слід, що  (Тут випадкова величина  пов'язана з випадковою величиною  формулою  ). Звідси и .

Замінюючи в цих формулах и  їх виразами через варіанти  і спрощуючи отримані при цьому формули, матимемо

и .

У цих формулах в якості постійної  беруть ширину інтервалу по  , А в якості  - Середину серединного інтервалу. Якщо серединних інтервалів два (при парному числі інтервалів), то в якості  слід взяти середину одного з цих інтервалів, наприклад, має велику частоту.

завдання

1.Побудуйте полігон частот для даних варіаційних рядів:

а)  ; б) .

2. Побудуйте полігон відносних частот:

а)  ; б) .

3.Побудуйте гістограму частот і відносних частот за даним розподілом вибірки:

a)

 номер інтервалу  частковий інтервал  Сума частот варіант інтервалу  щільність частоти
 [2, 7]  
 [7, 12]  
 [12, 17]  
 [17, 22]  
 [22, 27]  

b)

 номер інтервалу  частковий інтервал  Сума частот варіант інтервалу  щільність частоти
 [3, 5]  
 [5, 7]  
 [7, 9]  
 [9, 11]  
 [11,13]  
 [13,15]  
 [15,17]  

с)

 інтервал  1 <  <5  5 <  <9  9 <  <13  13 <  <17  17 <  <20

4. Знайдіть вибіркові середні для даних розподілів вибірки:

а)  ; b) .

5. Знайдіть вибіркову середню і вибіркову дисперсію для даних вибірки:

6. Дано розподіл 50 робочих механічного цеху за тарифним розрядом:

 тарифний розряд
 Частота (кол. Раб.)

а) Побудуйте полігон розподілу робочих за тарифним розрядом;

б) Знайдіть медіану і моду даного розподілу робочих.

в) Знайдіть вибіркову середню і вибіркову дисперсію для даних вибірки:

7.За заданим виборкамрешіте наступні підзадачі:

а) складіть варіаційний ряд;

б) обчисліть відносні частоти (частості) і накопичені частості;

в) побудуйте полігон і гістограму варіаційного ряду;

г) складіть емпіричну функцію розподілу;

д) побудуйте графік емпіричної функції розподілу;

е) знайдіть числові характеристики варіаційного ряду:

- середнє арифметичне,

- Дисперсію,

- Середньоквадратичне (стандартне) відхилення,

- Моду,

- Медіану.

7. 1. 2 4 2 4 3 3 3 2 0 6 1 2 3 2 2 4 3 3 5 1

0 2 4 3 2 2 3 3 1 3 3 3 1 1 2 3 1 4 3 1

7 4 3 4 2 3 2 3 3 1 4 3 1 4 5 3 4 2 4 5

3 6 4 1 3 2 4 1 3 1 0 0 4 6 4 7 4 1 3

 . Початок першого інтервалу - 0. Довжина інтервалів - 1.

7.2. 0 4 2 0 5 1 1 3 0 2 2 4 3 2 3 3 0 4 5 1

3 1 5 2 0 2 2 3 2 2 2 6 2 1 3 1 3 1 5 4

5 5 3 2 2 0 2 1 1 3 2 3 5 3 5 2 5 2 1 1

2 3 4 3 2 3 2 4 2

 . Початок першого інтервалу - 0. Довжина інтервалів - 1.

7.3. 3 7 4 6 1 4 2 4 6 5 3 2 9 0 5 6 7 7 3 1

5 5 4 2 6 2 1 5 3 3 1 5 6 4 4 3 4 1 5 5

3 4 3 7 4 5 6 7 5 2 4 6 6 7 7 3 5 4 4 3

5 5 7 6 6 1

 . Початок першого інтервалу - 0. Довжина інтервалів - 1.

 



 Завдання для самоперевірки |  Поняття оцінки параметрів. точкова оцінка

 Інтервальні оцінки. Довірчий інтервал |  Розподілу при невідомому (і обсязі вибірки). |  Довірчий інтервал для дисперсії нормального розподілу |  Визначення обсягу вибірки |  Застосування методу найменших квадратів для обробки результатів спостережень |

© um.co.ua - учбові матеріали та реферати