Головна

Інтервали прогнозу за лінійним рівнянням регресії.

  1. Автокорреляция в залишках, її вимір і інтерпретація. Критерій Дарбіна-Уотсона в оцінці якості трендового рівняння регресії.
  2. Вибір форми рівняння регресії.
  3. Виконання найважливіших параметрів прогнозу соціально-економічного розвитку Республіки Білорусь у першому півріччі 2012 р
  4. ДВАДЦЯТЬ ДРУГА ЛЕКЦІЯ. Подання про розвиток і регресії. Етіологія
  5. Для цього визначимо інтервали знакопостоянства її похідної
  6. Довірчі інтервали для інтерквантільного проміжку
  7. Зонинефтегазонакопленія - об'єкти локального прогнозу

У прогнозних розрахунках за рівнянням регресії визначається те, що рівняння не є реальним, для  є ще стандартна помилка  . Тому интервальная оцінка прогнозного значення

Висловимо з рівняння

 , Тобто стандартна помилка  залежить  і помилки коефіцієнта регресії b,

.

З теорії вибірки відомо, що  . Використовуючи в якості оцінки  залишкову дисперсію на одну ступінь свободи  , Отримаємо формулу розрахунку помилки середнього значення змінної y: .

Помилка коефіцієнта регресії: .

У прогнозних розрахунках за рівнянням регресії визначається рівняння як точковий прогноз  при  , Тобто шляхом підстановки в рівняння регресії  . Однак точковий прогноз явно нереальний.

 - Формула стандартної помилки пророкує значення y при заданих  , Характеризує помилку положення лінії регресії. Величина стандартної помилки  , Досягає min при  , І зростає в міру того, як «віддаляється» від  в будь-якому напрямку. Тобто чим більше різниця між  і x, тим більше помилка  , З якої передбачається середнє значення y для заданого значення .

Можна очікувати найкращі результати прогнозу, якщо ознака - фактор x знаходиться в центрі області спостережень х і не можна очікувати хороших результатів прогнозу при видаленні  від .

Якщо ж значення  виявляється за межами спостережуваних значень х, використовуваних при побудові ЛР, то результати прогнозу погіршуються в залежності то того, наскільки  відхиляється від області можна побачити значень фактора х. Довірить. інтервали при .

На графіку довірчої кордону  є гіперболи, розташовані по обидва боки від лінії регресії.

Дві гіперболи по обидві сторони від ЛР визначають 95% -ві довірчі інтервали для середнього значення y при заданому значенні x.

Однак фактичні значення y варіюють біля середнього значення  . Індивідуальні значення y можуть відхилятися від  на величину випадкової помилки  , Дисперсія якої оцінюється як залишкова дисперсія на одну ступінь свободи  . Тому помилка пророкує індивідуального значення y повинна включати не тільки стандартну помилку  , Але і випадкову помилку.

Середня помилка прогнозованого індивідуального значення y  складе:

.

При прогнозуванні на основі УР слід пам'ятати, що величина прогнозу залежить не тільки від стандартної помилки індивідуального значення y, а й від точності прогнозу значень фактора x.

Його величина може задаватися на основі аналізу інших моделей виходячи з конкретної ситуації, а також з аналізу динаміки даного чинника.

Розглянута формула середньої помилки індивідуального значення ознаки y (  ) Може бути використана також для оцінки суттєвості відмінності пророкує значення виходячи з регресійній моделі і висунутої гіпотези розвитку подій.

Поняття про множинної регресії. Класична лінійна модель множинної регресії (КЛММР). Визначення параметрів рівняння множинної регресії методом найменших квадратів.

Парна регресія використовується при моделюванні, якщо вплив інших факторів, що впливають на об'єкт дослідження можна знехтувати.

Наприклад, при побудові моделі споживання того чи іншого товару від доходу дослідник припускає, що в кожній групі доходу однаково вплив на споживання таких факторів, як ціна товару, розмір сім'ї, її склад. Однак, впевненості в справедливості цього твердження немає.

Прямий шлях вирішення такого завдання полягає у відборі одиниць сукупності з однаковими значеннями всіх інших факторів, крім доходу. Він призводить до планування експерименту - метод, який використовується в природничо-наукових дослідженнях. Економіст позбавлений можливості регулювати інші фактори. Поведінка окремих економічних змінних контролювати не можна, тобто не вдається забезпечити рівність інших умов для оцінки впливу одного досліджуваного фактора.

Як вчинити в цьому випадку? Треба виявити вплив інших факторів, ввівши їх в модель, тобто побудувати рівняння множинної регресії.

такого роду рівняння використовується при вивченні споживання.

коефіцієнти bj - Приватні похідні у по факторами хi

 за умови, що всі інші хi = const

Розглянемо сучасну споживчу функцію (вперше 30-і роки запропонував Кейнс Дж. М.) як модель виду С = f (y, P, M, Z)

c- споживання. у - дохід

P - ціна, індекс вартості.

M - готівкові гроші

Z - ліквідні активи

При цьому

Множинна регресія широко використовується у вирішенні проблем попиту, прибутковості акцій, при вивченні функцій витрат виробництва, в макроекономічних питаннях і інших питаннях економетрики.

В даний час множинна регресія - один з найбільш поширених методів в економетрики.

Основна мета множинної регресії - Побудувати модель з великим числом факторів, визначивши при цьому вплив кожного з них окремо, а також сукупний вплив на модельований показник.

Побудова рівняння множинної регресії починається з вирішення питання про специфікацію моделі. Вона включає в себе 2 кола питань:

1. відбір факторів

2. вибір рівняння регресії.

Включення в рівняння множинної регресії того чи іншого набору факторів пов'язано з поданням дослідника про природу взаємозв'язку моделируемого показника з іншими економічними явищами. Вимоги до факторів, включених у множинну регресію

1. вони повинні бути кількісно вимірні, якщо необхідно включити в модель якісний фактор, який не має кількісного виміру, то йому потрібно надати кількісну визначеність (наприклад, в моделі врожайності якість грунту задається у вигляді балів; в моделі вартості об'єктів нерухомості: райони повинні бути проранжовано ).

2. фактори не повинні бути інтеркорреліровани і тим більше перебувати в точної функціонального зв'язку.

Включення в модель факторів з високою интеркорреляций, коли Rуx1x1x2 для залежності  може привести до небажаних наслідків - система нормальних рівнянь може виявитися погано обумовленої і спричинити за собою нестійкість і ненадійність оцінок коефіцієнтів регресії.

Якщо між факторами існує висока кореляція, то не можна визначити їх ізольоване вплив на результативний показник і параметри рівняння регресії виявляються інтерпретуються.

У рівняння  передбачається, що фактори х1 і х2 незалежні один від одного, rх1х2 = 0, тоді параметр b1 вимірює силу впливу фактора х1 на результат у при незмінному значенні фактора х2. якщо rх1х2 = 1, то зі зміною фактора х1 фактор х2 не може залишатися незмінним. Звідси b1 і b2 можна інтерпретувати як показники роздільного впливу х1 і х2 і на у.

Приклад, розглянемо регресію собівартості одиниці продукції у (руб.) Від заробітної плати працівника х (руб.) І продуктивності праці z (од. На годину).

у = 22600 - 5x - 10z + e

коефіцієнт b2 = -10, Показує, що з ростом продуктивності праці на 1 од. собівартість одиниці продукції знижується на 10 руб. при постійному рівні оплати.

Разом з тим параметр при х не можна інтерпретувати як зниження собівартості одиниці продукції за рахунок зростання заробітної плати. Негативне значення коефіцієнта регресії при змінної х обумовлено високою кореляцією між х і z (rхz = 0,95). Тому зростання заробітної плати при незмінності продуктивності праці (без урахування інфляції) бути не може.

Включені в множинну регресію фактори повинні пояснити варіацію незалежної змінної. Якщо будуватися модель з набором р чинників, то для неї розраховується показник детермінації R2, Яка фіксує частку пояснене варіації результативної ознаки за рахунок розглянутих в регресії р факторів. Вплив інших неврахованих в моделі факторів оцінюється як 1-R2 c відповідної залишкової дисперсією S2.

При додатковому включенні в регресію р + 1 фактора коефіцієнт детермінації повинен зростати, а залишкова дисперсія зменшується.

R2p+1> = R2p і S2p+1 <= S2p

Якщо ж цього не відбувається і дані показники практично мало відрізняються один від одного, то включений в аналіз фактор xр + 1 не покращує модель і практично є зайвим чинником.

Якщо для регресії, що включає 5 факторів R2 = 0,857, і включений 6 дало R2 = 0,858, то недоцільно включати в модель цей фактор.

Насичення моделі зайвими чинниками не тільки не знижує величину залишкової дисперсії і не збільшує показник детермінації, але і призводить до статистично не значущі параметрів регресії за критерієм t-Стьюдента.

Таким чином, хоча теоретично регресійна модель дозволяє врахувати будь-яке число факторів, практично в цьому немає необхідності.

Відбір факторів проводитися на основі теоретико-економічного аналізу. Однак, він часто не дозволяє однозначно відповісти на питання про кількісну взаємозв'язку розглянутих ознак і доцільності включення фактора в модель. Тому відбір факторів здійснюється в дві стадії:

на першій - підбирають фактори, виходячи із сутності проблеми.

на другий - на основі матриці показників кореляції визначають t-статистики для параметрів регресії.

Коефіцієнти інтеркорреліціі (тобто кореляція між пояснюють змінними) дозволяють виключити з моделей дублюючі фактори. Вважається, що дві змінні явно колінеарні, тобто знаходяться між собою в лінійній залежності, якщо rхiхj > = 0.7.

Оскільки однією з умов побудови рівняння множинної регресії є незалежність дії факторів, тобто rхixj = 0, коллінеарність факторів порушує цю умову. Якщо фактори явно колінеарні, то вони дублюють один одного і один з них рекомендується виключити з регресії. Перевагу при цьому віддається не фактору, більш тісно пов'язаного з результатом, а тому фактору, який при досить тісному зв'язку з результатом має найменшу тісноту зв'язку з іншими факторами. У цій вимозі проявляється специфіка множинноїрегресії як методу дослідження комплексного впливу чинників в умовах їх незалежності один від одного.

Розглянемо матрицю парних коефіцієнтів кореляції при вивченні залежності у = f (x, z, v)

  y x z v
y      
x  0,8    
z  0,7  0,8  
v  0,6  0,5  0,2

Очевидно, фактори x і z дублюють один одного. В аналіз доцільно включить фактор z, а не х, так як кореляція z з у слабше ніж кореляція фактора х з у (rуz ух), Але зате слабкіше межфакторная кореляція (rzvхv)

Тому в даному випадку в рівняння множинної регресії включає фактори z і v

За величиною парних коефіцієнтів кореляції виявляється лише явна коллінеарність факторів. Але найбільш труднощі виникають при наявності мультиколінеарності факторів, коли більш ніж два фактори пов'язані між собою лінійною залежністю, тобто має місце сукупне вплив факторів один на одного. Наявність мультиколінеарності факторів може означати, що деякі фактори будуть завжди діяти в унісон. В результаті варіація у вихідних даних перестає бути повністю незалежною, і не можна оцінити вплив кожного фактора окремо. Чим сильніше мультіколлінеарності факторів, тим менш надійна оцінка розподілу суми пояснене варіації за окремими факторами за допомогою МНК.

Якщо розглянута регресія у = a + bx + cx + dv + e, то для розрахунку параметрів, застосовується МНК

Sy = Sфакт + Se

або = +

загальна сума = факторна + залишкова



Попередня   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34   35   Наступна

властивості залишків | Незміщеність МНК-оцінок | спроможність оцінок | Ефективність (оптимальність) оцінок | Несмещённость. | Ефективність. | Протиріччя між несмещённостью і мінімальною дисперсією. | Вплив збільшення розміру вибірки на точність оцінок. | Спроможність. | Коваріація. Коефіцієнт коваріації. Показники якості регресії: лінійний коефіцієнт регресії, коефіцієнт детермінації. |

© um.co.ua - учбові матеріали та реферати