На головну

Статистичне моделювання зв'язку методом кореляційного і регресійного аналізу

  1.  Мережа без обхідних напрямків - мережа, в якій для зв'язку станцій (вузлів) використовується єдиний шлях
  2.  I. Якісні методи системного аналізу.
  3.  II. Моделювання зв'язку соціально-економічних явищ.
  4.  III. Моделювання зв'язку соціально-економічних явищ.
  5.  III. Моделювання системи як етап дослідження.
  6.  Public Relation (зв'язки з громадськістю)
  7.  Quot; Молекули Містики "(екзогенні та ендогенні) як елемент зв'язку матеріального і духовного.

У загальному вигляді задача статистики в області вивчення взаємозв'язків полягає не тільки в кількісній оцінці їх наявності, напрямку і сили зв'язку, а й у визначенні форми (аналітичного виразу) впливу факторних ознак на результативний. Для її вирішення застосовують методи кореляційного і регресійного аналізу

завдання кореляційного аналізу зводяться до виміру тісноти відомої зв'язку між варьирующими ознаками, визначенню невідомих причинних зв'язків (причинний характер яких, має бути з'ясоване за допомогою теоретичного аналізу) і оцінці факторів, що роблять найбільший вплив на результативну ознаку.

завданнями регресійного аналізу є вибір типу моделі (форми зв'язку), встановлення ступеня впливу незалежних змінні на залежну і визначення розрахункових значень, залежною змінною (функції регресії).

Рішення всіх названих завдань призводить до необхідності комплексного використання цих методів.

Дослідження зв'язків в умовах масового спостереження і дії випадкових факторів здійснюється, як правило, за допомогою економіко-статистичних моделей. В широкому сенсі Модель - Це аналог, умовний образ (зображення, опис, схема, креслення і т. П.) Будь-якого об'єкта, процесу або події, наближено відтворює "оригінал". Модель являє собою логічне або математичний опис компонентів і функцій, що відображають істотні властивості модельованого об'єкта або процесу, дає можливість встановити основні закономірності зміни оригіналу. У моделі оперують показниками, обчисленими для якісно однорідних масових явищ (сукупностей). Вираз моделі у вигляді функціональних рівнянь використовують для розрахунку середніх значень модельованого показника по набору заданих величин і для виявлення ступеня впливу на нього окремих факторів.

За кількістю включаються факторів моделі можуть бути однофакторний и багатофакторним (Два і більше факторів).

Залежно від пізнавальної мети статистичні моделі поділяються на структурні, динамічні и моделі зв'язку.

Розглянемо основні проблеми статистичного моделювання зв'язку методами кореляційного і регресійного аналізу.

Двомірна лінійна модель кореляційного і регресійного аналізу (однофакторний лінійний кореляційний і регресійний аналіз). Найбільш розробленою в теорії статистики є методологія так званої парної кореляції, розглядає вплив варіації факторного ознаки * на результативний ознакою і представляє собою однофакторний кореляційний и регресійний аналіз. Оволодіння теорією і практикою побудови та аналізу двомірної моделі кореляційного і регресійного аналізу є вихідну основу для вивчення багатофакторних стохастичних зв'язків.

Найважливішим етапом побудови регресійної моделі (рівняння регресії) є встановлення в аналізі вихідної інформації математичної функції. Складність полягає в тому, що з безлічі функцій необхідно знайти таку, яка краще за інших висловлює реально існуючі зв'язки між аналізованими ознаками. Вибір типу функції може спиратися на теоретичні знання про досліджуваному явищі, досвід попередніх аналогічних досліджень, або здійснюватися емпірично - перебором і оцінкою функцій різних типів і т. П.

При вивченні зв'язку економічних показників виробництва (діяльності) використовують різного виду рівняння прямолінійної і криволінійної зв'язку. Увага до лінійним зв'язкам пояснюється обмеженою варіацією змінних і тим, що в більшості випадків нелінійні форми зв'язку для виконання розрахунків перетворять (шляхом логарифмування або заміни змінних) в лінійну форму. Рівняння однофакторний (парної) регресії має вигляд:

 (1.7.3.)

де  -Теоретично значення результативної ознаки, отримані за рівнянням регресії; а0 , a1 - Коефіцієнти (параметри) рівняння регресії.

оскільки a0 є середнім значенням у в точці х = 0, економічна інтерпретація часто утруднена або взагалі неможлива.

Коефіцієнт парної лінійної регресії а1 має сенс показника сили зв'язку між варіацією факторної ознаки x і варіацією результативної ознаки у. Рівняння (5.3) показує середнє значення зміни результативної ознаки у при зміні факторної ознаки х на одну одиницю його виміру, т. е. варіацію у. припадає на одиницю варіації х. знак а1 вказує напрямок цієї зміни.

параметри рівняння а0 , a1 знаходять методом найменших квадратів (Метод рішення систем рівнянь, при якому в якості рішення приймається точка мінімуму суми квадратів відхилень), т. Е. В основу цього методу покладена вимога мінімальності сум квадратів відхилень емпіричних даних yi від вирівняних :

 (1.7.4.)

Для знаходження мінімуму даної функції прирівняємо до нуля її частинні похідні і отримаємо систему двох лінійних рівнянь, яка називається системою нормальних рівнянь:

 (1.7.5.)

Вирішимо цю систему в загальному вигляді:

 (1.7.6.)

 (1.7.7.)

визначивши значення  і підставивши їх у рівняння зв'язку

 знаходимо значення х, залежать тільки від заданого значення х.

Перевірка адекватності регресійної моделі. Для практичного використання моделей регресії велике значення має їх адекватність, т. е. відповідність фактичним статистичними даними.

Кореляційний та регресійний аналіз звичайно (особливо в умовах так званого малого і середнього бізнесу) проводиться для обмеженої за обсягом сукупності. Тому показники регресії і кореляції - параметри рівняння регресії, коефіцієнти кореляції і детермінації можуть бути перекручені дією випадкових факторів. Щоб перевірити наскільки зги показники характерні для всієї генеральної сукупності, чи не є вони результатом збігу випадкових обставин, необхідно перевірити адекватність побудованих статистичних моделей.

При чисельності об'єктів аналізу до 30 одиниць виникає необхідність перевірки значущості (суттєвості) кожного коефіцієнта регресії. При цьому з'ясовують наскільки обчислені параметри характерні для відображення комплексу умов: чи не є отримані значення параметрів результатами дії випадкових причин.

значимість коефіцієнтів простої лінійної регресії (стосовно совокупностям, у яких n <30) здійснюють за допомогою t-критерію Стьюдента. При цьому обчислюють розрахункові (фактичні) значення t-критерію

для параметра a0

 (1.7.8.)

для параметра a1

 (1.7.9.)

де n- обсяг вибірки

 (1.7.10.)

(5.10) - середньоквадратичне відхилення результативної ознаки у від вирівняних значень

 (1.7.11.)

або

 (1.7.12.)

-среднеквадратіческое відхилення факторної ознаки х від загальної середньої .

Попередньо обчислені значення, порівнюють з критичними t, які визначають за таблицею Стьюдента з урахуванням прийнятого рівня значущості а і числом ступенів свободи варіації v = n-2. У соціально-економічних дослідженнях рівень значущості а зазвичай приймають рівним 0,05. Параметр визнається значущим (істотним) за умови, якщо tрозр.> tтабл. В такому випадку практично неймовірно, що знайдені значення параметрів обумовлені тільки випадковими збігами.

Перевірка адекватності регресійної моделі може бути доповнена кореляційним аналізом. Для цього необхідно визначити тісноту кореляційної зв'язку між змінними х и у. Тіснота кореляційної зв'язку, як і будь-який інший, може бути виміряна емпіричним кореляційним відношенням  , коли (Межгрупповая дисперсія) характеризує відхилення групових середніх результативної ознаки від загальної середньої:

 (1.7.13.)

де  - Загальна дисперсія результативної ознаки.

 (1.7.14.)

 (1.7.15.)

Говорячи про корреляционном відношенні як про показник вимірювання тісноти залежності, слід отлипать від емпіричного кореляційного відносини - теоретичне.

Теоретичне кореляційне відношення ? являє собою відносну величину, яка утворюється в результаті порівняння середнього квадратичного відхилення вирівняних значень результативної ознаки  т. е. розрахованих за рівнянням регресії, із середнім квадратаческім ставленням емпіричних (фактичних) значень результативності ознаки :

 (1.7.16.)

де
 - Дисперсія вирівняних значень результативної ознаки

 (1.7.17.)

 (1.7.18.)

тоді - дисперсія емпіричних (фактичних) значень

результативної ознаки.

 (1.7.19.)

Зміна значення ? пояснюється впливом факторної ознаки. В основі розрахунку кореляційного відношення лежить правило складання дисперсій, т. Е.

 (1.7.20.)

де  - Відображає варіацію у за рахунок всіх інших факторів, крім X, т. е. є залишкової дисперсією:

 (1.7.21.)

тоді формула теоретичного кореляційного відносини набуде вигляду:

 (1.7.22)

або  (1.7.23.)

Подкоренное вираз кореляційного відносини є коефіцієнт детермінації (Заходи визначеності, причинності).

Коефіцієнт детермінації показує частку варіації результативного ознаки під впливом варіації ознаки-фактора.

Теоретичне кореляційне відношення застосовується для вимірювання тісноти зв'язку при лінійній і криволінійної залежностях між результативним і факторингу ознакою. При криволінійних зв'язках теоретичне кореляційне відношення, що обчислюється за вищенаведеними формулами часто називають індексом кореляції R.

Як видно з наведених формул, кореляційне відношення може перебувати в межах від 0 до 1, т. Е. (0

Крім того, при лінійній формі рівняння застосовується інший показник тісноти зв'язку -лінійний коефіцієнт кореляції:

 (1.7.24.)

або
 (1.7.25.)

Для практичних обчислень при малому числі спостережень n?20 ? 30 лінійний коефіцієнт кореляції обчислюють за формулою:

 (1.7.26.)

Значення лінійного коефіцієнта кореляції важливо для дослідження соціально-економічних явищ і процесів, розподіл яких близько до нормального. Він приймає значення в інтервалі: -1 <р <1.

Негативні значення вказують на зворотний зв'язок,
 позитивні - на пряму. при г = 0 лінійна зв'язок відсутній. чим
 ближче коефіцієнт кореляції за абсолютною величиною до одиниці, тим
 тісніше зв'язок між ознаками. І, нарешті, при г = ± 1 зв'язок -функціональна.

Квадрат лінійного коефіцієнта кореляції г2 називається лінійним коефіцієнтом детермінації. З визначення коефіцієнта детермінації очевидно, що його числове значення завжди укладено і межах від 0 до 1, т. Е. 0 ? г2 ?1. Ступінь тісноти зв'язку повністю відповідає теоретичному кореляційному відношенню, яке є більш універсальним показником тісноти зв'язку в порівнянні з лінійним коефіцієнтом кореляції.

Факт збігів і розбіжностей значень теоретичного кореляційного відносини ? і лінійного коефіцієнта кореляції г використовується для оцінки форми зв'язку.

Вище зазначалося, що за допомогою теоретичного кореляційного відносини вимірюється тіснота зв'язку будь-якої форми, а за допомогою лінійного коефіцієнта кореляції - тільки прямолінійною. Отже, значення ? і г2 збігаються тільки при наявності прямолінійною зв'язку. Розбіжність цих величин свідчить, що зв'язок між досліджуваними ознаками не прямолінійна, а криволінійна. Встановлено, що якщо різниця квадратів ?2 і г2 не перевищує 0,1, то гіпотезу про прямолінійною формі зв'язку можна вважати підтвердженою.

Показники тісноти зв'язку, обчислені за даними порівняно невеликий статистичної сукупності, можуть спотворюватися дією випадкових причин. Це викликає необхідність перевірки їх суттєвості, дає можливість поширювати висновки за результатами вибірки на генеральну сукупність.

Для оцінки значущості коефіцієнта кореляції г використовують t-критерій Стьюдента, який застосовується при t- розподілі, відмінному від нормального.

При лінійної однофакторний зв'язку t-критерій можна розрахувати за формулою:

 (1.7.27.)

де (n-2) - число ступенів свободи при заданому рівні значимості ?, і обсязі вибірки n.

отримане значення  порівнюють з табличним значенням t-критерію (для ? = 0,05 і 0,01). Якщо розраховане значення  перевершує табличне значення критерію  то практично неймовірно, що знайдене значення обумовлено тільки випадковими коливаннями (т. е. відхиляється гіпотеза про його випадковості).

Економічна інтерпретація параметрів регресії. Після перевірки адекватності, встановлення точності і надійності побудованої моделі (рівняння регресії) її необхідно проаналізувати. Перш за все потрібно перевірити чи узгоджуються знаки параметрів з теоретичними уявленнями і міркуваннями про направлення впливу ознаки -Фактори на результативну ознаку (показник).

Для зручності інтерпретації параметра а1 використовують коефіцієнт еластичності. Він показує середні зміни результативного ознаки при зміні факторної ознаки на 1% і обчислюється за формулою,%:

(1.7.28.)



 Найпростіші методи вивчення стохастичних зв'язків |  непараметричні методи

 Завдання № 8. |  Завдання № 9. |  Завдання № 10. |  Завдання № 11. |  Поняття і сутність варіації |  показники варіації |  Завдання № 3. |  Завдання № 4. |  Сутність статистичного зв'язку соціально-економічних явищ |  Форми і види зв'язків |

© um.co.ua - учбові матеріали та реферати