загрузка...
загрузка...
На головну

Тема. Показники та аналіз варіації

  1. CR-аналіз журналу «Дипломат», №3-2005
  2. GAP-аналіз.
  3. I. Аналіз чутливості ПРОЕКТУ
  4. III. «Наприклад» в аналізі
  5. PEST-аналіз і приклад його використання
  6. SNW- аналіз.
  7. SWOT - аналіз на прикладі фабрики з виробництва взуття.

питання:

1. Поняття варіації. Абсолютні показники варіації.

2. Відносні показники варіації.

3. Дисперсія. види дисперсії

4. Емпіричне кореляційне відношення.

5. Показники форми розподілу.

1. Поняття варіації. Абсолютні показники варіації

варіація - ця різниця в значеннях якої-небудь ознаки у різних одиниць даної сукупності в один і той же період або момент часу.

Наприклад, працівники фірми розрізняються за доходами, витратами часу на роботу, рівнем освіти, рівня кваліфікації і т.д. Варіація виникає в результаті того, що індивідуальні значення ознаки складаються під сукупним впливом різноманітних факторів (умов), які по-різному поєднуються в кожному окремому випадку.

Показники варіації є числовий мірою рівня коливання ознаки. Чим більше варіанти окремих одиниць сукупності різняться між собою, тим більше вони відрізняються від своєї середньої, і навпаки, - чим менше варіанти відрізняються один від одного, тим менше вони відрізняються від середньої, яка в такому випадку буде більш реально представляти всю сукупність. Ось чому обмежуватися обчисленням однієї середньої в ряді випадків не можна. Потрібні і інші показники, що характеризують відхилення окремих значень від середньої.

У статистиці застосовують ряд узагальнюючих показників варіації. .

До абсолютних показників варіації відносяться: розмах варіації, середнє лінійне відхилення,дисперсія і середньоквадратичне відхилення, квартильное відхилення. Для оцінки інтенсивності варіації і для порівняння її в різних сукупностях використовують відносні показники варіації: коефіцієнт осциляції, відносне лінійне відхилення, коефіцієнт варіації.

Самим елементарним показником варіації ознаки є розмах варіації, представляє собою різницю між максимальним і мінімальним значеннями ознаки:

 . (1)

Величина розмаху характеризує лише максимальне відмінність значень ознаки.

Показником варіації виступає середнє лінійне відхилення. Цей показник розраховується за формулою для несгруппірованних даних

 , (2)

для згрупованих даних

 . (3)

- середнє значення ознаки,

 - i значення ознаки (варіанти),

- частот i варіанти,

п - обсяг сукупності.

Середнє лінійне відхилення не можна поставити у відповідність, з будь-яким ймовірним законом, в тому числі і з нормальним розподілом, параметром якого є середньоквадратичне відхилення.

Розрахунок середнього квадратичного відхилення проводиться за формулами: для несгруппірованних даних

 , (4)

для згрупованих даних

 . (5)

Середнє квадратичне відхилення за величиною в реальних сумах завжди більше середнього лінійного відхилення. співвідношення  залежить від наявності в сукупності різких, що виділяються відхилень і може служити індикатором «засміченості» сукупності неоднорідними елементами: чим це співвідношення більше, тим сильніше подібна «засміченість». Для нормального закону розподілу .  Середнє квадратичне відхилення - це узагальнююча характеристика розмірів варіації ознаки в сукупності; воно показує, на скільки в середньому відхиляються конкретні варіанти від їх середнього значення; є абсолютною мірою коливання ознаки і виражається в тих же одиницях, що і варіанти, тому економічно добре інтерпретується.

Квадрат середнього квадратичного відхилення дає величину дисперсії s2. Формула дисперсії:

Для згрупованих даних  . (6)

Для не згруповані даних  . (7)

Простими перетвореннями можуть бути отримані формули розрахунку дисперсії методом моментів  .Розрахунок За цією формулою дає рівність результатів з (7) при точному значенні середньої арифметичної величини. Якщо середня округлена, то приведе до похибки результатів.

Ще одним показником сили варіації, що характеризує її не по всій сукупності, а лише в центральній частині, служить середнє квартальне відстань, тобто середня велічінаразності між квартилями, що позначається далі як q:

 . (8)

Сила варіації в центральній частині сукупності, як правило, менше, ніж в цілому по всій сукупності. Співвідношення між середнім лінійним відхиленням і середнім квартильное відхиленням також служить для вивчення структури варіації: велике значення такого співвідношення говорить про наявність слабо варьирующего «ядра» і сильно розсіяного навколо цього ядра оточення. наприклад, d: q = 1,23, Що говорить про невеликій відмінності сили варіації в центральній частині сукупності і на її периферії.

Під альтернативним розуміється такий статистичний показник, який приймає одне з двох можливих значень (стать - жіноча або чоловіча, виріб придатне або непридатний, план з випуску продукції - виконаний або не виконано). Конкретний зміст альтернативного ознаки встановлюється самим дослідником. Позначимо: 1 - наявність даного нас ознаки; 0 - його відсутність; р - Частка одиниць, що володіють даними ознакою; q - Частка одиниць, що не володіють даними ознакою; р + q = 1. Розрахунок середнього значення альтернативного ознаки і середнє відхилення альтернативної ознаки проводять за формулами:

середнє значення альтернативної ознаки

 , (9)

середнє відхилення альтернативної ознаки

 . (10)

2. Відносні показники варіації

Для оцінки інтенсивності варіації і для порівняння її в різних сукупностях і тим більше для різних ознак необхіднівідносні показники варіації.Вони вичісляютсякак відносини абсолютних показників сили варіації, розглянутих раніше, до середньої арифметичної величини ознаки. Розраховуються такі показники:

1) відносний розмах варіації VR (Коефіцієнт осциляції):

 (11)

2) лінійний коефіцієнт варіації:

 (12)

3) коефіцієнт варіації

 (13)

4) відносне квартальне відстань:

 (14)

Коефіцієнт варіації використовують не тільки для порівняльної оцінки варіації одиниць сукупності, а й як характеристику однорідності сукупності. Сукупність вважається кількісно однорідною і середня є типовою характеристикою для даної сукупності, якщо коефіцієнт варіації не перевищує 33%.

Приклад.

Є такі вихідні дані по окремим комерційним банкам РФ за звітний рік:

Таблиця 1

Дані про власний капітал банків регіону

 номер банку  Власний капітал, млн. Руб.
 335,2
 377,2
 355,1
 404,7
 406,2
 406,2
 442,3
 507,3
 534,7
 544,4
 642,7
 665,2
 769,7
 796,9
 834,6
 870,2

 

На підставі представлених даних розрахувати показники варіації.

Абсолютні показники:

1) розмах варіації: (R)

R = Xmax-Xmin,

де Xmax і Xmin - Максимальне і мінімальне значення ознаки відповідно. Так як дані проранжовано в порядку зростання, то маємо:

R = 870,2 - 335,2 = 535,0 (млн. Руб.)

2) середнє лінійне відхилення (  ):

= ,

де xi - Індивідуальні значення ознаки;

 середня арифметична величина.

значення  розраховується за наступною формулою:  , Де n - число банків.

Розрахунок показників представимо в таблиці 6.2 .:

Таблиця 2

Вихідні дані для розрахунку показників варіації

 N п / п Xi  | хi - | Xi2
 335,2  230,69  112359,04
 377,2  228,69  113703,84
 355,1  210,79  126096,01
 404,7  161,19  163782,09
 406,2  159,69  164998,44
 442,3  123,59  195629,29
 507,3  58,59  257353,29
 534,7  31,19  285904,09
 544,4  21,49  296371,36
 642,7  76,81  413063,29
 665,7  99,81  443156,49
 665,7  99,81  443156,49
 769,7  203,81  592438,09
 796,9  230,81  634730,89
 834,6  268,71  696557,16
 870,2  304,31  757248,04
 Разом  8488,4  2410,17  5253391,41

3) Дисперсія (s2):

4) Середнє квадратичне відхилення (s):

Відносні показники:

1) Коефіцієнт осциляції (VR):

VR =

VR =

2) Лінійний коефіцієнт варіації :

3) Коефіцієнт варіації (V):

На підставі проведених розрахунків можна зробити наступні основні висновки:

- В середньому індивідуальні значення ознаки відхиляються від середньої арифметичної на 160,68 млн. Руб. за середнім лінійному відхиленню і на 173,19 млн. руб. по середньому квадратичному відхиленню;

- Дані за власним капіталом банків є досить однорідними (коефіцієнт варіації не перевищує 33%) і, отже, середня арифметична буде типовою, надійної оцінкою по досліджуваній ознаці.

3. Дисперсія. види дисперсії

Варіація ознаки обумовлена ??різними факторами, деякі з цих факторів можна виділити, якщо статистичну сукупність розбити на групи по будь-якою ознакою, тобто побудувати аналітичну угруповання. Тоді, поряд з вивченням варіації ознаки по всій сукупності в цілому, стає можливим вивчити варіацію для кожної зі складових її групи, а також і між цими групами.

Дисперсія результативної ознаки всередині групи при відносному сталості ознаки-фактора виникає за рахунок інших факторів (не пов'язаних з досліджуваним). Така дисперсія називається залишкової (Та коливання, яка залишилася при закріпленні досліджуваного фактора ).

Межгрупповая дисперсія відноситься на рахунок досліджуваного фактора (і факторів, пов'язаних з ним), тому називається факторної.

У найпростішому випадку, коли сукупність розчленована на групи по одному фактору, вивчення варіації досягається за допомогою обчислення і аналізу трьох видів дисперсій: загальної, груповий і всередині груповий.

Загальна дисперсія s2 вимірює варіацію ознаки по всій сукупності під впливом всіх факторів, що обумовили цю варіацію. Вона дорівнює середньому квадрату відхилень окремих значень ознаки Х- Від загальної середньої і може бути обчислена як проста дисперсія або зважена дисперсія за формулою (6) або (7).

Межгрупповая дисперсія d2 характеризує систематичну варіацію результативної ознаки, яка обумовлена ??впливом ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових (приватних) середніх , Від загальної середньої . Межгрупповая дисперсія обчислюється за формулою:

 (15)

де mj - Чисельність одиниць у групі,

j - Номер групи,

- Середнє значення ознаки в j групі,

- загальна середня.

Внутригрупповая (приватна) дисперсія , Відображає випадкову варіацію, тобто частина варіації, яка обумовлена ??впливом неврахованих факторів і не залежить від ознаки-фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи х від середньої арифметичної цієї групи (Груповий середньої) і може бути обчислена як проста дисперсія або як зважена дисперсія за формулами, відповідно:

,  , (16)

- Середнє значення ознаки в j групі,

 - i значення ознаки (варіанти),

- частот i варіанти,

п - обсяг сукупності.

На підставі всередині груповий дисперсії по кожній групі, тобто на підставі можна визначити загальну середню з внутрішньогрупових дисперсій :

 . (17)

згідно правилом додавання дисперсій загальна дисперсія дорівнює сумі середньої з внутрішньогрупових і груповий дисперсій:

 . (18)

Користуючись правилом додавання дисперсій, можна завжди по двом відомим дисперсія визначити третю - невідому, а також судити про силу впливу группировочного ознаки.

Очевидно, чим більше частка груповий дисперсії в загальній дисперсії, тим сильніше вплив группировочного ознаки на досліджувану ознаку.

Тому в статистичному аналізі широко використовується емпіричний коефіцієнт детермінації (h2) - Показник, який представляє собою частку груповий дисперсії в загальній дисперсії результативної ознаки і характеризує силу впливу группировочного ознаки на освіту загальної варіації:

 (19)

Емпіричний коефіцієнт детермінації показує частку варіації результативного ознаки у під впливом факторної ознаки х (Інша частина загальної варіації у обумовлюється варіацією інших чинників). При відсутності зв'язку емпіричний коефіцієнт детермінації дорівнює нулю, а при функціональному зв'язку - одиниці.

Емпіричне кореляційне відношення - це корінь квадратний з емпіричного коефіцієнта детермінації:

воно показує тісноту зв'язку між об'єднувальних і результативним ознаками.

Емпіричне кореляційне відношення h, Як і h2, Може приймати значення від 0 до 1.

Якщо зв'язок відсутній, то кореляційне відношення дорівнює нулю, тобто всі групові середні будуть рівні між собою, між груповий варіації не буде. Значить, группіровочний ознака ніяк не впливає на утворення спільної варіації.

Якщо зв'язок функціональна, то кореляційне відношення буде дорівнює одиниці. В цьому випадку дисперсія групових середніх дорівнює загальній дисперсії (  ), Тобто внутрішньогрупової варіації не буде. Це означає, що группіровочний ознака цілком визначає варіацію досліджуваного результативного ознаки.

Чим значення кореляційного відносини ближче до одиниці, тим тісніше, ближче до функціональної залежності зв'язок між ознаками.

Для якісної оцінки тісноти зв'язку на основі показника емпіричного кореляційного відносини можна скористатися співвідношеннями Чеддока:

hэ  0,1-0,3  0,3-0,5  0,5-0,7  0,7-0,9  0,9-0,99
 сила зв'язку  слабка  помірна  помітна  тісна  вельми тісний

Приклад.

Є такі дані про величину кредитів, виданих приватним особам, російськими та іноземними банками, що функціонують на території РФ:

Таблиця 3

 банки  Видано кредитів приватним особам, млн. Руб.
 російські  2557,3; 2025,1; 1682,2; 1608,5; 1346,3; 1340,2; 1312,4; 1308,6
 іноземні  410,1; 273,2; 187,5; 148,1

На підставі наведених даних перевірити правило складання дисперсій і визначити вплив факторної ознаки на варіацію величини кредитів, виданих приватним особам.

Рішення.

Проаналізуємо варіацію кредитів приватним особам по всіх банках. Для цього розрахуємо загальну дисперсію за такою формулою:

,

де  значення ознаки по кожній одиниці;

 загальна середня, розрахована за всіма одиницям.

Загальна дисперсія характеризує варіацію обсягу кредитів приватним особам під впливом всіх факторів. Однак з таблиці видно, що варіація обсягу кредитів приватним особам залежить насамперед від факторного ознаки.

Побудуємо групову таблицю, отриману за результатами аналітичної угруповання:

Таблиця 4

 банки  Число банків, nj  Середній обсяг кредитів приватним особам,  Дисперсія обсягу кредитів приватним особам в групі, s2j
 російські  1647,6  173186,45
 іноземні  254,7  10105,44
 Разом    

По кожній групі розраховується внутригрупповая дисперсія, яка характеризує варіацію обсягу кредитів приватним особам під впливом всіх інших випадкових чинників (крім фактора, покладеного в основу угруповання), за такою формулою:

,

де j = 1?k (порядковий номер)

i = 1?n (номер одиниці)

Таким чином, маємо:

В цілому для всіх одиниць розраховується середня з внутрішньогрупових дисперсій:

Для оцінки варіації обсягу кредитів приватним особам під впливом факторної ознаки розрахуємо міжгрупова дисперсію:

Загальну середню (  ) Визначимо за такою формулою:

 (млн. руб.)

тоді

Загальна дисперсія являє собою суму груповий і середньої з внутрішньогрупових дисперсій:

 , Що відповідає загальній дисперсії, розрахованої вище.

Для оцінки впливу факторної ознаки на варіацію обсягу кредитів приватним особам розрахуємо частку груповий дисперсії в загальній, яка називається коефіцієнтом детермінації (h2):

 (78,4%)

Отже, на 78,4% варіація обсягу кредитів приватним особам залежить від факторної ознаки і на 21,6% (100-78,4) - від впливу всіх інших факторів.

Таким чином, в поєднанні з методом угруповань правило складання дисперсій дозволяє виявити фактори, що найбільший вплив на варіацію ознаки в сукупності і дати кількісну оцінку ступеня впливу цих факторів.

5. Показники форми розподілу

Для подальшого вивчення характеру варіації використовуються середні значення різних ступенів відхилень окремих величин ознаки від його середньої арифметичної величини. Ці показники отримали назву центральних моментів розподілу порядку, відповідного ступеня, в яку зводяться відхилення, або початкових моментів.

Відповідно до властивості середньої арифметичної центральний момент першого порядку дорівнює нулю, другий центральний момент являє собою дисперсію. Величина третього моменту залежить, як і його знак, від переважання позитивних відхилень в кубі над негативними або навпаки.

При нормальному і будь-якому іншому строго симетричному розподілі сума позитивних відхилень в кубі строго дорівнює сумі негативних відхилень в кубі. Центральний момент третього порядку використовується при оцінці асиметрії. Четвертий момент використовується для оцінки ексцесу.

центральні моменти

 порядок моменту  Формула
 по які згрупованим даними  по згрупованим даними
 перший
 другий
 третій  
 четвертий  

Показники форми розподілу:

асиметрія(As) показник характеризує ступінь асиметричності розподілу.

Англійська статистик К. Пірсон на основі різниці між середньою величиною і модою запропонував розрахунок показника асиметрії.

Отже, при (лівосторонньої) негативною асиметрії  . При (правобічної) позитивної асиметрії .

Графічно правобічна і лівостороння асиметрія представлена ??на рісісунке 6.1.

Мал. 1. Графіки асиметричності розподілу.

Для розрахунку асиметрії можна використовувати центральні моменти. тоді:

,

де ?3 - Центральний момент третього порядку.

Показник Пірсона залежить від ступеня асиметрії в середній частині ряду розподілу, а показник асиметрії, заснований на моменті третього порядку, від крайніх значень ознаки.

- ексцес (Ек) характеризує крутизну графіка функції в порівнянні з з нормальним розподілом при тій же силі варіації:

,

де ?4 - Центральний момент 4-го порядку, що визначається за формулою:

Для побудови кривої нормального розподілу використовуються два параметри: середня арифметична і середнє відхилення.

За показниками асиметрії і ексцесу розподілу можна судити про близькість розподілу до нормального. Розподіл можна вважати нормальним, якщо показники асиметрії і ексцесу не перевищують своїх дворазових середніх квадратичних відхилень, розрахованих за формулами:

якщо відношення ,  , То асиметрія є незначною, розподіл можна вважати нормальним.

 



Попередня   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   Наступна

ВСТУП | Тема. Статистика як наука і галузь практичної діяльності | Тема. Статистичне вимірювання і спостереження соціально - економічних явищ | Тема. Зведення і групування статистичних даних | Макет таблиці, що являє собою результат дискретної угруповання | Тема. Графічний і табличний методи подання статистичних даних | Макет комбінаційної таблиці | Тема. Абсолютні і відносні величини | Тема. Середні величини. структурні середні | вибірка |

загрузка...
© um.co.ua - учбові матеріали та реферати