Головна

Чисельності для різних видів вибірок

  1. Використовувані сигнали можна класифікувати по різних ознаках. У першу чергу їх потрібно підрозділити на детерміновані (регулярні) і випадкові.
  2. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ ПРОДОВОЛЬЧИХ ТОВАРІВ В ДОНЕЦЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р., тис. т
  3. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ ПРОДОВОЛЬЧИХ ТОВАРІВ В ПОЛІСЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р., тис. т
  4. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ ПРОДОВОЛЬЧИХ ТОВАРІВ В ПРИЧОРНОМОРСЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р., тис. т
  5. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ ПРОДОВОЛЬЧИХ ТОВАРІВ У КАРПАТСЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р., тис. т
  6. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ ПРОДОВОЛЬЧИХ ТОВАРІВ У ПОДІЛЬСЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р., тис. т.
  7. ВИРОБНИЦТВО ОСНОВНИХ ВИДІВ СІЛЬСЬКОГОСПОДАРСЬКОЇ ПРОДУКЦІЇ У ПОЛІСЬКОМУ ЕКОНОМІЧНОМУ РАЙОНІ у 2000 р. (у господарствах усіх категорій), тис. т

Для вибіркового спостереження властиві помилки реєстрації і помилки репрезентативності.

Розбіжність між характеристиками вибіркової та генеральної сукупностей, що називаються помилками репрезентативності,виникають внаслідок різниці у структурі вибіркової і генеральної сукупності.

Помилки репрезентативностістановлять різницю між середніми і відносними показниками вибіркової сукупності та відповідними показниками генеральної сукупності. Вони поділяються на систематичні та випадкові.

Систематичніпомилки репрезентативностізумовлені внаслідок порушення принципів проведення вибіркового спостереження.

Випадковіпомилкирепрезентативності зумовлені тим, що вибіркова сукупність не відображає точно середні і відносні показники генеральної сукупності.

Визначення величини випадкових помилок репрезентативності є одним із головних завдань теорій вибіркового методу.

Структура генеральної сукупності цілком однозначна, і їй відповідає цілком певне значення середнього розміру (або частки) ознаки, що вивчається. Вибіркова ж сукупність формується на основі випадкового відбору, через це її склад відрізняється від складу генеральної сукупності, відрізняється, природно, і значення середнього розміру (або частки) ознаки, що вивчається.

Якщо з однієї і тієї ж генеральної сукупності проводиться декілька вибірок, то в кожну з них потраплять різні одиниці і, отже, кожній вибірковій сукупності буде відповідати своя середня. Звідси випливає важливий висновок: вибіркова середня, на відміну від генеральної, - величина змінна. Змінною або випадковою величиною буде і помилка репрезентативності.

У практичних статистичних дослідженнях вибіркове спостереження проводиться один раз, тому фактично доводиться мати справу з однією з безлічі вибіркових середніх, але з якою саме - сказати неможливо. Щоб отримати свідчення про точність результатів вибіркового спостереження, математична статистика дає апарат характеристики складу генеральної сукупності і формулу середньої помилки, тобто середньої величини з усіх можливих помилок при безлічі випадкових вибірок.

Для узагальнюючої характеристики помилки вибірки вираховують середню помилку репрезентативності, яку позначають через грецьку літеру (мю) μ і називають ще стандартом.

Для визначення середньої помилки репрезентативності простої випадкової і механічної вибірок застосовують чотири формули для повторного і без повторного відбору.

Таблиця 7.1 - Формули для визначення середньої помилки

репрезентативності

Спосіб відбору При визначенні середньої При визначенні частки
Повторний
Безповторний

де μ - середня помилка репрезентативності;

- середній квадрат відхилень у вибірці;

п - чисельність вибіркової сукупності;

N - чисельність генеральної сукупності;

- необстежена частка генеральної сукупності;

- частка обстеженої частини вибіркової сукупності;

w - частка даної ознаки у вибірці;

(1 - w) - частка протилежної ознаки у вибірці.

На практиці частіше використовують безповторний відбір, який гарантує більш точні результати.

Для узагальнюючої характеристики помилки вибірки поряд із середньою розраховують ще і граничну помилку вибірки.

При вибірковому спостереженні розмір граничної помилки репрезентативності Δ може бути більший, дорівнювати або менший від середньої помилки репрезентативності w. Тому величину граничної помилки репрезентативності обчислюють з певною ймовірністю р, якій відповідає t-разове значення μ. З уведенням показника кратності помилки t,формула граничної помилки репрезентативності матиме вид:

деμ- середня помилка вибірки;

t - коефіцієнт довіри, який залежить від ймовірності визначення граничної помилки.

Ймовірність відхилень вибіркової середньої від генеральної середньої за достатньо великого обсягу вибірки і обмеженій дисперсії генеральної сукупності підпорядковується закону нормального розподілу. Ймовірність цих відхилень за різних значеннях t визначається за формулою:

Значення цього інтеграла за різних значень t табульовані і наводяться в спеціальних таблицях, наприклад:

для t = 1 р(Δ≤μ) = 0,683;

для t = 2 р(Δ≤μ) = 0,954;

для t = 3 р(Δ≤μ) = 0,997;

для t = 4 р(Δ≤μ) = 0,999.

Гранична помилка вибірки дає можливість установити, в яких межах знаходиться величина генеральної середньої або частки. Із теореми Чебишева знаходять, що:

і

Додаючи граничну помилку вибірки до вибіркової частки і віднімаючи її від неї, знаходять межі генеральної частки:

і

На основі формул граничної помилки вибірки розв'язують наступні завдання:

1) визначають довірчі межі генеральної середньої і частки з прийнятою ймовірністю;

2) визначають ймовірність того, що відхилення між вибірковими і генеральними характеристиками не перевищать визначену величину;

3) визначають необхідну чисельність вибірки, яка із заданою ймовірністю забезпечить прийняту точність вибіркових показників.

Разом з абсолютною величиною граничної помилки вибірки визначається і відносна помилка вибірки, як відношення граничної помилки середньої або частки до відповідної характеристики вибіркової сукупності:

При проведенні вибіркового спостереження в економічних дослідженнях переважно прагнуть до того, щоб відносна помилка репрезентативності вибірки не перевищувала 5...10 %.

Розглянемо застосування формул помилок репрезентативності вибірки на конкретних прикладах.

Приклад. Поставлено завдання вивчити рівень кваліфікації робочих електрозв'язку вибірковим методом. Для цього необхідно визначити середній тарифний розряд і частку робочих, що мають 5 і 6-й розряди, й установити межі помилок цих показників з вірогідністю 0,95 (t = 1,96). Методом випадкового відбору по частці із 1200 робочих було вибрано 80 чоловік, і на основі вивчення рівня їх кваліфікації складена таблиця (табл. 7.2).

Середній розряд обстежених робочих складає:

Дисперсія:

Таблиця 7.2 - Розподіл у вибірці робочих електрозв'язку за тарифними

розрядами і розрахунок величин для визначення середнього

розряду і дисперсії

Розряд (х) Число відібраних робочих (f) xf
-2,5
-1,5 22,5
-0,5
88 0,5 5,5
1,5 31,5
2,5 37,5
Всього: -

 

Середнє квадратичне відхилення:

Середня помилка вибіркового середнього розряду:

З вірогідністю 0,95 отриманих результатів вибіркового обстеження гарантують можливу помилку середнього тарифного розряду в абсолютному вираженні в межах а у відносному вираженні

Таким чином, середній тарифний розряд усіх робочих організації електрозв'язку є типовою характеристикою і знаходиться в межах

Частка робочих, що мають 5 і 6-й розряди, у вибірковій сукупності склала

Середня помилка частки робочих, що мають 5 і 6-й розряди

Гранична помилки вибіркової частки робочих, що мають 5 і 6-й розряди, складає

З вірогідністю 0,95 можна стверджувати, що частка всіх робочих організації електрозв'язку, що мають 5 і 6-й розряди, знаходиться в межах

тобто від 15,8 до 34,2 % розкид частки, отриманий у вибірці, значний.

Відносна помилка складає:

%,

що свідчить про недостатню достовірність вибіркового спостереження 80 чоловік для оцінки частки робочих з високими розрядами.

При організації проведення вибіркового спостереження важливе значення має правильне визначення необхідної чисельності вибірки, яка з відповідною ймовірністю забезпечить установлену точність результатів спостереження.

Чисельність вибірки залежить від наступних факторів:

1) від варіації досліджуваної ознаки. Чим більша варіація, тим більшою повинна бути чисельність вибірки і, навпаки;

2) від розміру можливої граничної помилки вибірки. Чим менший розмір можливої помилки, тим більша повинна бути чисельність вибірки. Існує правило, якщо помилку потрібно зменшити в три рази, то чисельність вибірки збільшують у дев'ять разів;

3) від розміру ймовірності, з якою будуть гарантувати результати вибірки. Чим більша ймовірність, тим більша повинна бути чисельність вибірки;

4) від способу відбору одиниць у вибіркову сукупність для обстеження. Основні формули для знаходження необхідної чисельності вибірки для простої випадкової і механічної вибірок.

Таблиця 7.3 - Формули для знаходження необхідної чисельності вибірки

Способи відбору Чисельність вибірки
при визначенні середньої при визначенні частки
Повторний
Безповторний

За випадкового повторного відбору обсяг (необхідна чисельність) вибірки прямо пропорційний квадрату коефіцієнта довіри t2і дисперсії варіаційної ознаки σ2і обернено пропорційний квадрату можливої помилки вибірки Δ2. Для зменшення граничної помилки, наприклад, у 2 рази чисельність вибірки повинна бути збільшена в 4 рази. З трьох параметрів два (t і Δ) задаються дослідником, і трудність полягає в установленні розміру вибіркової дисперсії. Для цього використовується вся інформація, що є у розпорядженні дослідника: дані подібних і пробних досліджень, результати попередніх досліджень.

Покажемо застосування цих формул на прикладі.

Приклад. З метою удосконалення тарифів визначити, скільки телефонних з'єднань повинно бути обстежене, щоб гранична помилка середньої тривалості місцевих телефонних з'єднань, отриманої за наслідками обстеження 200 з'єднань, збільшилася (зменшилася) в 2 рази при довірчій вірогідності 0,997 (t = 3).

За наслідками обстеження 200 телефонних з'єднань установлено:

хв., σ2= 13,04, μх = 0,26 хв., гранична помилка

Δх = хв.

Якщо допустиме збільшення граничної помилки в 2 рази:

хв.,

то чисельність вибірки повинна скласти

телефонних з'єднань.

Щоб зменшити граничну помилку вдвічі:

потрібно збільшити чисельність вибірки до 800 з'єднань.

Приклад. Розрахувати необхідну чисельність вибірки для забезпечення репрезентативності вибіркових спостережень кваліфікації робочих організації електрозв'язку (див. приклад 1).

Нехай відносна помилка вибіркової частки робочих електрозв'язку, що мають 5 і 6-й розряди, не перевищує 15 %, тоді гранична помилка вибірки

Для отримання прийнятних результатів вибіркового обліку частки робочих, що мають вищі розряди, в аналізованому масиві обсяг вибіркової сукупності повинен скласти чол.

Розрахунок граничної помилки вибірки за типового відборупроводиться за допомогою формул (табл. 7.4).

Таблиця 7.4 - Формули для розрахунку граничної помилки вибірки

за типового відбору

Спосіб відбору Гранична помилка вибірки
для середньої для частки
Повторний
Безповторний

- середня групова дисперсія;

- середня дисперсія альтернативної ознаки для частки.

Необхідна чисельність типової вибірки визначається за формулою:

Гранична помилка серійної вибіркивизначається за формулами (табл. 7.5):

Таблиця 7.5 - Формули для розрахунку граничної помилки серійної

вибірки

Спосіб відбору Гранична помилка вибірки
для середньої для частки
Повторний
Безповторний

де -міжсерійна (міжгрупова) дисперсія середніх;

S- число серій в генеральній сукупності;

s - число відібраних серій.

Необхідна чисельність вибірки за серійного відбору визначається за формулами:

а) для повторного відбору :

б) для безповторного відбору:

У статистичній практиці вибіркове спостереження із великих масивів генеральної сукупності часто проводиться у вигляді комбінованої, ступеневоїабо багатофазної вибірок.

Загальна помилка за комбінованої вибірки складається із помилок, які можливі на кожному ступені, і визначається як корінь квадратний із квадратів помилок відповідних вибірок. Якщо серійну вибірку скомбінувати з простою випадковою або механічною, то гранична помилка вибірки визначається за формулою:

За моментного методу спостереженнягранична помилка частки визначається як при звичайної повторної простої випадкової вибірки.

Для визначення необхідної чисельності моментів спостереження застосовується формула:

За малих вибірокрозподіл вибіркових середніх і помилок вибірки відрізняється від нормального. Тому для оцінки результатів малої вибірки використовують дещо видозмінені формули. Середня помилка малої вибірки розраховується за формулою:

де

п - 1 - число ступенів вільності варіацій, які вказують на кількість різних можливих значень варіантів і їх середньою арифметичною.

7.5. Застосування засобів MS Excel у аналізі вибірок

За даними табл. 7.2 розглянемо приклад знаходження середньої і граничної помилок засобами MS Excel.

Середній розряд обстежених робочих знаходиться за формулою середньої арифметичної зваженої. Для цього необхідно використовувати дві вбудовані математичні функції СУММПРОИЗВ і СУММ. Результат розрахунку розмістимо у комірці В 10 (рис. 7.1).

Для обчислення дисперсії необхідно виконати проміжні розрахунки які розмістимо у комірках D2:E8 (рис. 7.1). У комірку В11 введемо формулу у які поділимо Е8 на В8.

Середнє квадратичне відхилення обчислюється у комірці В12 як корінь квадратний із дисперсії.

Середня помилка вибіркового середнього розряду розраховується шляхом введення формули у комірку В13 (рис. 7.1).

Рис. 7.1. Розрахунок середніх характеристик вибірки

Визначення меж генеральної середньої. В MS Excel для більш точного обчислення меж довірчих інтервалів при обсягу елементів у вибірці n < 30 можна використати функцію ДОВЕРИТ або процедурою Описательная статистика.

Установіть табличний курсор у комірку, де буде одержано результат (В14).

Для визначення меж довірчого інтервалу необхідно на панелі інструментів Стандартная натиснути кнопку Вставка функции (fx). У діалоговому вікні Мастер функции оберіть категорію Статистические и функцію ДОВЕРИТ, після чого натисніть ОК.

У робоче поле введіть умову задачі: Альфа (коефіцієнт довіри, який залежить від ймовірності визначення граничної помилки); Станд_откл (стандартне відхилення генеральної сукупності для інтервалу даних); Размер (обсяг вибірки) (рис. 7.2).

Рис. 7.2. Обчислення довірчих інтервалів для середньої

У комірці В14 з'явиться полуширина 95%-го довірчого інтервалу для середнього значення вибірки - 0,30. Іншими словами, з вірогідністю 0,95 отриманих результатів вибіркового обстеження гарантують можливу помилку середнього тарифного розряду в абсолютному вираженні в межах

Таким чином, середній тарифний розряд усіх робочих організації електрозв'язку є типовою характеристикою і знаходиться в межах

Відносне вираження помилки вибірки розраховано шляхом вводу формули у комірку В15, як відношення граничної помилки до середньої вибірки (рис. 7.3).

Рис. 7.3. Результати розрахунку помилок вибірки

Результати обчислень свідчать про достатню достовірність вибіркового спостереження 80 чоловік для оцінки середнього розряду робочих.

Питання і завдання для самоконтролю

7.1. Дайте визначення поняття вибіркового спостереження.

7.2. Назвіть основні переваги вибіркового спостереження перед суцільним.

7.3. Який основний недолік вибіркового спостереження?

7.4. Що таке помилка вибірки та як її визначають?

7.5. Що таке генеральна та вибіркова сукупності?

7.6. Які узагальнюючі показники генеральної та вибіркової сукупностей зазвичай порівнюють між собою та якими символами їх позначають?

7.7. Назвіть способи відбору одиниць з генеральної сукупності та дайте їм характеристику.

7.8. Назвіть етапи вибіркового дослідження та дайте їм характеристику.

7.9. Чим відрізняється індивідуальний відбір від групового?

7.10. Чим відрізняється повторний відбір від безповторного?

7.11. Що ви розумієте під вибірковою часткою? Як вона розраховується?

7.12. Яке число не повинне перевищувати чисельність одиниць вибіркового спостереження за малої вибірки?

7.13. У якому відборі елементи вибираються через рівні інтервали?

7.14. Як називається відхилення вибіркових характеристик від відповідних характеристик генеральної сукупності, яке виникає внаслідок порушень принципу випадковості відбору?

7.15. Як розраховується розмір граничної похибки середньої величини?

7.16. Запишіть межі, в яких знаходиться середня величина показника, що вивчається.

7.17. Наведіть методику розрахунку межі, в якій знаходиться частка показника, що вивчається і має певну ознаку.

7.18. Що є коефіцієнтом довіри?

7.19. За якою формулою розраховується достатній обсяг вибірки на основі:

а) відносної похибки вибірки для частки;

б) граничної похибки вибірки?

Література [3; 5; 7; 8; 15-24; 26].

 



  32   33   34   35   36   37   38   39   40   41   42   43   44   45   46   47   Наступна

Задачі для самостійного розв'язання | Поняття про ряди розподілу, їх види | Поняття про показники варіації і способи їх обчислення | Види дисперсій і правило їх додавання | Форми рядів розподілу та їх характеристика | Графічне зображення рядів розподілу | Аналіз рядів розподілу засобами MS Еxcel | Задачі для самостійного розв'язання | Поняття про вибіркове спостереження та його основні завдання | Основні умови наукової організації вибіркового спостереження |

© 2016-2022  um.co.ua - учбові матеріали та реферати