загрузка...
загрузка...
На головну

МЕТОДИ ПЕРВИННОЇ СТАТИСТИЧНОЇ ОБРОБКИ РЕЗУЛЬТАТІВ ЕКСПЕРИМЕНТУ

  1. I. 2.4. Принципи та методи дослідження сучасної психології
  2. I. Методи перехоплення.
  3. I. НОРМАТИВНА БАЗА ДЛЯ РОЗРОБКИ ПОЛОЖЕННЯ ПРО ПЕРВИННОЇ ОРГАНІЗАЦІЇ ПРОФСПІЛКИ
  4. I. Суб'єктивні методи дослідження ендокринної системи.
  5. I. Суб'єктивні методи дослідження кровотворної системи.
  6. I. Суб'єктивні методи дослідження органів жовчовиділення і підшлункової залози.
  7. I. Суб'єктивні методи дослідження органів сечовиділення.

Методами статистичної обробки результатів експерименту називаються математичні прийоми, формули, способи кількісних розрахунків, за допомогою яких показники, одержувані в ході експерименту, можна узагальнювати, приводити в систему, виявляючи приховані в них закономірності.

Йдеться про такі закономірності статистичного характеру, які існують між досліджуваними в експерименті змінними величинами.

1. Деякі з методів математико-статистичного аналізу дозволяють обчислювати так звані елементарні математичні статистики,характеризують вибірковий розподіл даних, наприклад

*вибіркове середнє,

* Вибіркова дисперсія,

* Мода,

* медіана і ряд інших.

2. Інші методи математичної статистики, наприклад

дисперсійний аналіз,

регресійний аналіз, дозволяють судити про динаміці зміни окремих статистик вибірки.

3. За допомогою третьої групи методів, Скажімо,

*кореляційного аналізу,

факторного аналізу,

методів порівняння виборочниеа даних, можна достовірно судити про статистичних зв'язках,

існуючих між змінними величинами, які досліджують в даному експерименті.

Всі методи математико-статистичного аналізу умовно діляться на первинні і вторічние1.

1 Наведені тут визначення і висловлювання не завжди є достатньо суворими з точки зору теорії ймовірностей і математичної статистики як склалися областей сучасної математики. Це зроблено для кращого розуміння даного тексту студентами, непідготовленими в області математики:

первинними називають методи, за допомогою яких можна отримати показники, безпосередньо відображають результати вироблених в експерименті вимірювань.

Відповідно під первинними статистичними показниками маються на увазі ті, які застосовуються в самих психодіагностичних методиках і є підсумком початкової статистичної обробки результатів психодіагностики.

вторинними називаються методи статистичної обробки, за допомогою яких на базі первинних даних виявляють приховані в них статистичні закономірності.

До первинних методів статистичної обробки відносять, Наприклад,

*визначення вибіркової середньої величини,

*вибіркової дисперсії,

*вибіркової моди і

*вибіркової медіани.

У число вторинних методів зазвичай включають

* Кореляційний аналіз,

* Регресійний аналіз,

* Методи порівняння первинних статистик у двох або декількох вибірок.

Розглянемо методи обчислення елементарних математичних статистик, почавши з вибіркового середнього.

ВИБІРКОВЕ СЕРЕДНЯ

вибіркове середнє значення як статистичний показник являє собою середню оцінку досліджуваного в експерименті психологічного якості.

Ця оцінка характеризує ступінь його розвитку в цілому у тієї групи випробовуваних, яка була піддана психодиагностическому обстеження. Порівнюючи безпосередньо середні значення двох або декількох вибірок, ми можемо судити про відносну ступеня розвитку у людей, що складають ці вибірки, оцінюється якості.

Вибіркове середнє визначається за допомогою наступної формули:

де

хср -виборочная середня величина або середнє арифметичне значення за вибіркою;

п - кількість випробуваних у вибірці або приватних психодіагностичних показників, на основі яких обчислюється середня величина;

xk - приватні значення показників у окремих досліджуваних. Всього таких показників п, тому індекс k даної змінної приймає значення від 1 до п;

? - Прийнятий в математиці знак підсумовування величин тих змінних, які знаходяться праворуч від цього знака.

вираз  відповідно означає суму всіх х з індексом k від 1 до n.

Приклад.Припустимо, що в результаті застосування психодіагностичної методики для оцінки деякого психологічного властивості у десяти піддослідних ми отримали наступні приватні показники ступеня розвиненості даного властивості в окремих піддослідних: х1 = 5, х2 = 4, х3 = 5, х4 = 6, х5 = 7, х6 = 3, х7 = 6, х8 = 2, х9 = 8, х10 = 4. Отже, п = 10, а індекс k змінює свої значення від 1 до 10 в наведеній вище формулі. Для даної вибірки середнє значення1, обчислене за цією формулою, дорівнюватиме:

1 Надалі, як це і прийнято в математичній статистиці, з метою скорочення тексту ми будемо опускати слова «вибіркове» і «арифметичне» і просто говорити про «середній» або «середнє значення».

У психодіагностику і в експериментальних психолого-педагогічних дослідженнях середнє, як правило, не обчислюється з точністю, що перевищує один знак після коми, тобто. е. з більшою, ніж десяті частки одиниці.

У психодіагностичних обстеженнях велика точність розрахунків не потрібно і не має сенсу, якщо взяти до уваги приблизність тих оцінок, які в них виходять, і достатність таких оцінок для виробництва порівняно точних розрахунків.

ДИСПЕРСІЯ

дисперсія як статистична, величина характеризує, наскільки приватні значення відхиляються від середньої величини в даній вибірці.

Чим більше дисперсія, тим більше відхилення або розкид даних. Перш ніж представляти формулу для розрахунків дисперсії, розглянемо приклад. Скористаємося тими первинними даними, які були наведені раніше і на основі яких обчислювалася в попередньому прикладі середня величина. Ми бачимо, що всі вони різні і відрізняються не тільки один від одного, а й від середньої величини. Міру їх загального відмінності від середньої величини і характеризує дисперсія. Її визначають для того, щоб можна було відрізняти один від одного величини, які мають однакову середню, але різний розкид.

Уявімо собі іншу, відмінну від попередньої вибірку первинних значень, наприклад таку: 5, 4, 5, 6, 5, 6, 5, 4, 5, 5. Легко переконатися в тому, що її середня величина також дорівнює 5,0. Але в даній вибірці її окремі приватні значення відрізняються від середньої набагато менше, ніж в першій вибірці. Висловимо ступінь цієї відзнаки за допомогою дисперсії, яка визначається за такою формулою:

де - вибіркова дисперсія, або просто дисперсія;

- вираз, що означає, що для всіх xk від першого до останнього в даній вибірці необхідно обчислити різниці між приватними і середніми значеннями, звести ці різниці в квадрат і підсумувати;

п - кількість випробуваних у вибірці або первинних значень, за якими обчислюється дисперсія.

Визначимо дисперсії для двох наведених вище вибірок приватних значень, позначивши ці дисперсії відповідно індексами 1 і 2:

Ми бачимо, що дисперсія по другій вибірці (0,4) значно менше дисперсії по першій вибірці (3,0). Якби не було дисперсії, то ми не в змозі були б розрізнити дані вибірки.

ВИБІРКОВЕ ВІДХИЛЕННЯ

Іноді замість дисперсії для виявлення розкиду приватних даних щодо середньої використовують похідну від дисперсії величину, звану вибіркове відхилення. Воно дорівнює квадратному кореню, витягується з дисперсії, і позначається тим же

самим знаком, що і дисперсія, тільки без квадрата-

МЕДИАНА

медианой називається значення досліджуваного ознаки, яке ділить вибірку, впорядковану за величиною цього показника, навпіл.

Праворуч і ліворуч від медіани в упорядкованому ряду залишається по однаковій кількості ознак. Наприклад, для вибірки 2, 3,4, 4, 5, 6, 8, 7, 9 медианой буде значення 5, так як зліва і праворуч від нього залишається по чотири показника. Якщо ряд включає в себе парне число ознак, то медіаною буде середнє, взяте як полусумма величин двох центральних значень ряду. Для наступного ряду 0, 1, 1, 2, 3, 4, 5, 5, 6, 7 медіана буде дорівнює 3,5.

Знання медіани корисно для того, щоб встановити, чи є розподіл приватних значень вивченого ознаки симетричним і наближається до так званого нормальному розподілу. Середня і медіана для нормального розподілу зазвичай збігаються або дуже мало відрізняються один від одного.

Якщо вибіркове розподіл ознак нормально, то до нього можна застосовувати методи вторинних статистичних розрахунків, засновані на нормальному розподілі даних. В іншому випадку цього робити не можна, так як в розрахунки можуть украстися серйозні помилки.

Якщо в книзі по математичній статистиці, де описується той чи інший метод статистичної обробки, є вказівки на те, що його можна застосовувати тільки до нормального або близького до нього розподілу ознак, то необхідно неухильно дотримуватися цього правила і отримане емпіричне розподіл ознак перевіряти на нормальність.

Якщо такої вказівки немає, то статистика застосовна до будь-якого розподілу ознак. Приблизно судити про те, є чи не є отримане розподіл близьким до нормального, можна, побудувавши графік розподілу даних, схожий на ті, які представлені на рис. 72. Якщо графік виявляється більш-менш симетричним, значить, до аналізу даних можна застосовувати статистики, призначені для нормального розподілу. У всякому разі, допустима помилка в розрахунках в даному випадку буде відносно невеликою.

Приблизні картини симетричного і несиметричного розподілів ознак показані на рис. 72, де точками т1 и т2 на горизонтальній осі графіка позначені ті величини ознак, які відповідають медианам, а х1 и х2 - ті, які відповідають середнім значенням.

Мал. 72.Графіки симетричного і несиметричного розподілу ознак: 1 - симетричний розподіл (всі відносяться до нього елементарні статистики позначені з допомогу індексу 1); 11 - несиметричне розподіл (його первинні статистики відзначені на графіку індексом 2).

МОДА

Мода ще одна елементарна математична статистика і характеристика розподілу досвідчених даних. Модою називають кількісне значення досліджуваної ознаки, найбільш часто зустрічається у вибірці. На графіках, представлених на рис. 72, моді відповідають самі верхні точки кривих, вірніше, ті значення цих точок, які розташовуються на горизонтальній осі.

Для симетричних розподілів ознак, в тому числі для нормального розподілу, значення моди збігаються зі значеннями середнього і медіани. Для інших типів розподілів, несиметричних, це не характерно.

Наприклад, в послідовності значень ознак 1, 2, 5, 2, 4, 2, 6, 7, 2 модою є значення 2, так як воно зустрічається частіше за інших значень - чотири рази.

Інтервал

Іноді вихідних приватних первинних даних, які підлягають статистичній обробці, буває досить багато, і вони вимагають проведення величезної кількості елементарних арифметичних операцій. Для того щоб скоротити їх число і разом з тим зберегти потрібну точність розрахунків, іноді вдаються до заміни вихідної вибірки приватних емпіричних даних на інтервали.

інтервалом називається група впорядкованих за величиною значень ознаки, замінна в процесі розрахунків середнім значенням.

Приклад.Уявімо наступний ряд приватних ознак: О, 1, 1, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 9, 9, 9, 10, 10, 11, 11, 11. Цей ряд включає в себе 30 значень.

Розіб'ємо представлений ряд на шість підгруп по п'ять ознак в кожному.

* Перша підгрупа включить в себе перші п'ять цифр,

* друга - Наступні п'ять і т. Д.

Обчислимо середні значення для кожної з п'яти освічених підгруп чисел. Вони відповідно дорівнюватимуть 1,2; 3,4; 5,2; 6,8; 8,6; 10,6.

Таким чином, нам вдалося звести вихідний ряд, що включає тридцять значень, до ряду, який містить всього шість значень, який підлягає середніми величинами. Це і буде інтервальний ряд, а проведена процедура - поділом вихідного ряду на інтервали.

Тепер все статистичні розрахунки ми можемо проводити не з вихідним рядом ознак, а з отриманим інтервальним рядом, і результати в рівній мірі будуть ставитися до вихідного ряду. Однак число вироблених в ході розрахунків елементарних арифметичних операцій буде набагато менше, ніж кількість тих операцій, які з цією ж метою довелося б виконати щодо вихідного ряду ознак.

На практиці, складаючи інтервальний ряд, рекомендується керуватися таким правилом: Якщо в вихідному ряду ознак більше ніж тридцять, то цей ряд доцільно розділити на п'ять-шість інтервалів і надалі працювати тільки з ними.

Для перевірки сказаного проведемо пробне обчислення середнього значення за наведеним вище ряду, що становить тридцять чисел, і по ряду, що включає тільки інтервальні середні значення. Отримані цифри з точністю до двох знаків після коми будуть відповідно рівні 5,97 і 5,97, т. Е. Є однаковими.



Попередня   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   Наступна

Питання 1. МАТЕМАТИКА І ПСИХОЛОГІЯ | Вступ | Історія розвитку | психологічні вимірювання | Нетрадиційні методи моделювання | критерій Фішера | МЕТОД корелляцію | Критичні значення коефіцієнтів кореляції | ФАКТОРНИЙ АНАЛІЗ | Питання 1. Ознаки і змінні |

загрузка...
© um.co.ua - учбові матеріали та реферати