Головна

Вибір функції. Тести Боксу-Кокса.

  1. I. Вибір електродвигуна
  2. I. Вибір електродвигуна і кінематичний розрахунок
  3. I. Вибір електродвигуна і кінематичний розрахунок
  4. II. Вибір цільових сегментів ринку.
  5. А) Первинний вибір життєвого шляху.
  6. А. ВИБІР РОБОТИ
  7. Альтернативні витрати та економічний вибір

Можливість побудови нелінійних моделей, як за допомогою їх приведення до лінійного вигляду, так і шляхом використання нелінійної регресії, значно підвищують універсальність регресійного аналізу, але і ускладнюють задачу дослідника.

Якщо ви обмежуєтеся парним регресійний аналізом, то можна побудувати поле кореляції, графік y (x) як діаграму розкиду. Однак зазвичай все не так просто. Часто кілька різних нелінійних функцій відповідають спостереженням, якщо вони лежать на деякій кривій.

При розгляді альтернативних моделей з одним і тим же визначенням залежною змінною процедура вибору досить проста. Найбільш розумним є оцінювання регресії на основі всіх можливих функцій, які можна уявити, і вибір функції, в найбільшою мірою пояснює зміни залежної змінної.

Якщо в прикладі ми отримали, що лінійна функція пояснює 64% дисперсії «у», а гіперболічна - 99,9%, то без коливань (R2yx) Вибираємо останню.

Однак різні моделі використовують різні функціональні форми, то проблема вибору моделі стає складнішою, так як не можна безпосередньо порівняти коефіцієнти R2yx або суми квадратів відхилень, тобто не можна порівнювати статистично для лінійного і логарифмічних варіантів моделі

Ще приклад:

Лінійна регресія R2 = 0,985. СКО = 385,2

Подвійна логарифмічна модель R2 = 0,9915, СКО = 0,02

У другому випадку СКО значно менше, але це нічого не вирішує. Значення log y <значно менше відповідних значень у, тому і залишки менше. величина R2 безрозмірна і в другому рівнянні відноситься до різним поняттям. У першому вимірює пояснення регресією частку дисперсії, у другому - пояснення регресією частку дисперсії log y. Якщо для однієї моделі R2 значно більше, ніж для іншої, можна зробити виправданий вибір. Якщо ж R21 @ R22 то проблема вибору ускладнюється. Для цього використовують тест Боксу-Кокса.

Порівняння у і log y використовує варіант тесту, розробленого Повному Зарембою. Він припустив таке перетворення масштабу спостережень у, при якому забезпечувалася б можливість безпосереднього порівняння СКО в лінійної і логарифмічною моделях. Процедура полягає в наступному:

1. Обчислюється середнє геометричне значення у в вибірці (воно збігається з експонентою середнього арифметичного log y, тому якщо ви вже оцінили логарифмічну регресію, то необхідно обчислити лише експоненту від цього значення).

2. перераховуються спостереження у, вони діляться на це значення, тобто (масштабується):

 - Перелічене значення для i спостереження.

3. Оцінюється регресія для лінійної моделі з використанням  замість у в якості залежної змінної і для логарифмічною моделі з використанням log (  ) Замість log (у); у всіх інших відносинах моделі повинні залишатися незмінними. Тепер, значення СКО для двох регресій можна порівняти, і отже, модель з меншою сумою квадратів відхилень забезпечує краще відповідне.

4. Для того, щоб перевірити, чи не забезпечує чи одна з моделей значимо краще відповідне можна обчислити величину  , Де Т-число спостережень, Z- відношення значень СКО в перелічених регрессий, і взяти її абсолютне значення (тобто ігнорувати знак «-» якщо він є.). Ця статистика має розподіл c2 з одним ступенем свободи. Якщо вона перевищує критерій-значення c2 при обраному рівні значущості, то робиться висновок про наявність значущої різниці в якості оцінювання.

Приклад: тест про витрати на продукти харчування так і витратах на житло в США. Для цих двох видів благ показали, що логарифмічна регресія - середнє значення log (у) = 4,8422 (1) і 4,6662 (2). Масштабуючі множники рівні e4.8422 і e4,6662

 СКО  витрати на харчування  витрати на житло
 лінійна регресія  0,0119  0,0341
 подвійна логарифмічна регресія.  0,0119  0,0221

З таблиці очевидно, що для регресії витрат на харчування відповідність однаково добре в обох випадках. У разі витрат на житло, логарифмічна регресія дає більш точну відповідність логарифмічного відношення значень СКО для других регресією = 0,4337, і після множення на 12,5 регрессий t = 4,52. Критерій-рівень c2 з одним ступенем свободи складе 3,84 при 5% рівні значущості і 6,64 при 1%.

Ці результати можуть здатися несподіваними, так як можна припустити, що з точки зору теорії модель з log є більш досконалою. Однак період вибірки настільки малий, що кривизна функції Енгеля, ймовірно не встигне проявитися, тому лінійна функція може забезпечити настільки ж гарне відповідність, що і нелінійна.

 



Попередня   39   40   41   42   43   44   45   46   47   48   49   50   51   52   53   54   Наступна

Оцінка якості моделі множинної регресії: F-критерій Фішера, t-критерій Стьюдента. Мультиколінеарності. Методи усунення мультиколінеарності. | Глава 4. Передумови методу найменших квадратів | Дослідження залишків величин регресії. | Проблема гетероскедастичності. Її економічні причини і методи виявлення. | Лінійні регресійні моделі з гетероскедастичними і автокоррелірованнимі залишками. | Узагальнений метод найменших квадратів. (ОМНК). | Приклад. | Нелінійні моделі регресії і їх лінеаризація. | Оцінка ступеня тісноти зв'язку між кількісними змінними. | Індекс кореляції, теоретичне кореляційне відношення. Коефіцієнт детермінації для нелінійних моделей. |

© um.co.ua - учбові матеріали та реферати