загрузка...
загрузка...
На головну

множинна кореляція

  1. B.1. Парна регресія і кореляція
  2. B.2. Множинна регресія і кореляція
  3. D.1. Парна регресія і кореляція
  4. D.2. Множинна регресія і кореляція
  5. Автокорреляция в залишках, її вимір і інтерпретація. Критерій Дарбіна-Уотсона в оцінці якості трендового рівняння регресії.
  6. Автокорреляция в залишках. Критерій Дарбіна-Уотсона
  7. Автокорреляция рівнів часового ряду

Практична значимість рівняння множинної регресії оцінюється за допомогою показника множинної кореляції і його квадрата - коефіцієнта детермінації.

Показник множинної кореляції характеризує тісноту розглянутого набору факторів з досліджуваним ознакою, або, інакше, оцінює тісноту спільного впливу чинників на результат.

Незалежно від форми зв'язку показник множинної кореляції може бути знайдений як індекс множинної кореляції:

 , (3.6)

де s2y - Загальна дисперсія результативної ознаки;

sост2 - Залишкова дисперсія для рівняння у = | (х1,х2, ...., Xp).

Методика побудови індексу множинної кореляції аналогічна побудові індексу кореляції для парної залежності. Межі його зміни ті ж: від 0 до 1. Чим ближче його значення до 1, тим тісніше зв'язок результативної ознаки з усім набором досліджуваних факторів. Величина індексу множинної кореляції повинна бути більше або дорівнює максимальному парному індексу кореляції:

При правильному включенні факторів у регресійній аналіз величина індексу множинної кореляції буде істотно відрізнятися від індексу кореляції парної залежності. Якщо ж додатково включені в рівняння множинної регресії фактори третьорядні, то індекс множинної кореляції може практично збігатися з індексом парної кореляції (відмінності в третьому, четвертому знаках). Звідси ясно, що, порівнюючи індекси множинної і парної кореляції, можна зробити висновок про доцільність включення в рівняння регресії того фактора. Так, якщо y розглядається як функція x і z і отриманий індекс множинної кореляції Ryzx = 0,85, а індекси парної кореляції при цьому були Ryx = 0,82 і Ryz = 0,75, то цілком зрозуміло, що рівняння парної регресії у = | (х) охоплювало 67,2% коливання результативної ознаки під впливом фактора x а додаткове аналіз фактора z збільшило частку пояснене варіації до 72,3%, тобто зменшилася частка залишкової варіації на 5,1 проц. Пункту (з 32,8 до 27,7%).

Розрахунок індексу множинної кореляції передбачає визначення рівняння множинної регресії і на його основі залишкової дисперсії:

.

Можна користуватися наступною формулою індексу множинної кореляції:

 . (3.7)

При лінійної залежності ознак формула індексу кореляції може бути представлена ??наступним виразом:

 (3.8)

де  - Стандартизовані коефіцієнти регресії;

 - Парні коефіцієнти кореляції результату з кожним фактором.

У справедливості цієї формули можна переконатися, якщо звернутися до лінійного рівняння множинної регресії в стандартизованому масштабі і визначити для його індекс множинної кореляції як

 (3.9)

Або, що те ж саме,

 (3.10)

У формулі (3.10) чисельник подкоренного вираження являє собою факторну суму квадратів відхилень для стандартизованих змінних:

оскільки и  , Індекс множинної кореляції для лінійної рівняння в стандартизованном масштабі можна записати у вигляді

 (3.11)

Підставами в цю формулу вираз  через

отримаємо:

Так як  то отримаємо формулу індексу множинної кореляції наступного виду (3.8):

Формула індексу множинної кореляції для лінійної регресії отримала назву лінійного коефіцієнта множинної кореляції, Або, що те ж саме, сукупного коефіцієнта кореляції.

Можливо також при лінійної залежності визначення сукупного коефіцієнта кореляції через матрицю парних коефіцієнтів кореляції:

 (3.12)

де Dr - визначник матриці парних коефіцієнтів кореляції;

Dr11 - Визначник матриці межфакторной кореляції.

для рівняння  визначник матриці коефіцієнтів парної кореляції набуде вигляду:

 . (3.13)

Визначник нижчого порядку r11 залишається, коли викреслюються з матриці коефіцієнтів парної кореляції перший стовпець і перший рядок, що і відповідає матриці коефіцієнтів парної кореляції між факторами:

 . (3.14)

Як видом, величина множинного коефіцієнта кореляції залежить не тільки від кореляції результату з кожним з факторів, а й від межфакторной кореляції. Розглянута формула дозволяє визначити сукупний коефіцієнт кореляції, не звертаючись при цьому до рівняння множинної регресії, а використовуючи лише парні коефіцієнти кореляції.

При трьох змінних для двухфакторного рівняння регресії дана формула сукупного коефіцієнта кореляції легко приводиться до наступного вигляду:

 (3.15)

Індекс множинної кореляції дорівнює сукупному коефіцієнту кореляції не тільки при лінійної залежності розглянутих ознак. Тожественность цих показників, як і а парної регресії, має місце і для криволінійної залежності, нелінійної по змінним. Так, якщо фірми модель прибутку у має вигляд

,

де х1 - Питомі витрати на рекламу;

х2 - Капітал фірми;

х3 - Частка продукції фірми в загальному обсязі продажів даної групи товарів по регіону;

х4 - Відсоток збільшення обсягу продажів фірми в порівнянні з попереднім роком.

Тоді незалежно від того; що фактор х1 заданий лінійно, а чинники х2, х3, х4 - В логарифмах, оцінка тісноти зв'язку може бути проведена за допомогою лінійного коефіцієнта множинної кореляції. Так, якщо розглянута модель в стандартизованном вигляді виявилася такою:

а парні коефіцієнти кореляції прибутку з кожним з її чинників склали

,

то коефіцієнт множинної детермінації виявиться рівним:

Той же результат дасть і індекс множинної детермінації, певний через співвідношення залишкової і загальної дисперсії результативної ознаки.

Інша працювати з криволінійної регресією, нелінійної по оцінюваним параметрам. Припустимо, що розглядається виробнича функція Кобба - Дугласа:

де P - обсяг продукції;

L - витрати праці;

K - величина капіталу;

b1 + b2 = 1.

Логаріфміруя її, отримаємо лінійне в логарифмах рівняння

Оцінивши параметри цього рівняння по МНК, можна знайти теоретичні значення обсягу продукції  і відповідно залишкову суму квадратів  , Яка використовується в розрахунку індексу детермінації (кореляції):

Однак при цьому не можна забувати, що МНК застосовується не до вихідних даних продукції, а до їх логарифмам. Тому в індексі кореляції з загальною сумою квадратів  порівнюється залишкова дисперсія, яка визначена з теоретичних значень логарифмів продукції:  - антилогарифмів  , Тобто по  шляхом потенціювання знайшли .

У показниках множинної кореляції (індекс і коефіцієнт) використовується залишкова дисперсія, яка має систематичну помилку в сторону зменшення, тим більш значну, чим більше параметрів визначається в рівнянні регресії при заданому обсязі спостережень n. Якщо число параметрів при xj одно m і наближається до обсязі спостережень, то залишкова дисперсія буде близька до нуля і коефіцієнт (індекс) кореляції наблизиться до одиниці навіть при слабкій зв'язку факторів з результатом. Для того щоб не допустити можливого перебільшення тісноти зв'язку, використовується скоригований індекс (коефіцієнт) множинноїрегресії.

Скоригований індекс множинної кореляції містить поправку на число ступенів свободи, а саме залишкова суму квадратів  ділиться на число ступенів свободи залишкової варіації (n-m-1), а загальна сума квадратів відхилень  - На число ступенів свободи в цілому по сукупності (n - 1).

Формула скоригованого індексу множинне детермінації має вигляд:

 , (3.17)

де m - число параметрів при змінних х;

n - число спостережень.

оскільки  , То величину скоригованого індексу детермінації можна представити у вигляді

 (3.18)

Чим більше величина m, тим сильніше відмінності и .

Для лінійної залежності ознак скоригований коефіцієнт множинної кореляції визначається за тією ж формулою, що і індекс множинної кореляції, тобто як корінь квадратний з  . Відмінність полягає лише в тому, що в лінійній залежності під m мається на увазі число факторів включених в регресійну модель, а в криволінійних залежності m - число параметрів при х і їх перетвореннях (х2, Lnx і ін.), Яке може бути більшою за кількість факторів як економічних змінних. Так, якщо у = f (x1, x2), То для лінійної регресії m = 2, а для регресії виду

число параметрів при х дорівнює 4, тобто m = 4. При заданому обсязі спостережень за інших рівних умов зі збільшенням числа незалежних змінних (параметрів) скоригований коефіцієнт множинної детермінації убуває. Його величина може стати і негативною при слабких зв'язках результату з факторами. У цьому випадку він повинен вважатися рівним нулю. При невеликому числі спостережень скоригована величина коефіцієнта множинної детермінації R2 має тенденцію переоцінювати частку варіації результативного ознаки, пов'язану з впливом факторів, включених в регресійну модель.

Приклад.Припустимо, що при n = 30 для лінійного рівняння регресії з чотирма факторами R2 = 0,7, а з урахуванням коригування на число ступенів свободи

.

Чим більше обсяг сукупності, по якої обчислена регресія, тим менше відрізняються показники  і R2. Так, вже при n = 50 при тому ж значенні R2 і m величина  складе 0,673.

У статистичних пакетах прикладних програм в процедурі множинноїрегресії зазвичай наводиться скоригований коефіцієнт (індекс) множинної кореляції (детермінації). Величина коефіцієнта множинної детермінації використовується для оцінки якості регресійній моделі. Низьке значення коефіцієнта (індексу) множинної кореляції означає, що в регресійну модель невключени істотні фактори - з одного боку, а з іншого боку - розглянута форма зв'язку не відображає реальні співвідношення між змінними, включеними в модель. Потрібні подальші дослідження щодо поліпшення якості моделі і збільшення її практичної значущості.



Попередня   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   Наступна

Протиріччя між несмещённостью і мінімальною дисперсією. | Вплив збільшення розміру вибірки на точність оцінок. | Спроможність. | Коваріація. Коефіцієнт коваріації. Показники якості регресії: лінійний коефіцієнт регресії, коефіцієнт детермінації. | Дисперсійний аналіз. | Інтервали прогнозу за лінійним рівнянням регресії. | Кв.отклоненія | Класична модель множинної лінійної регресії. | Передумови класичної багатовимірної лінійної регресійної моделі. | Вибір форми рівняння регресії. |

загрузка...
© um.co.ua - учбові матеріали та реферати