На головну

Конструювання індексів і шкал

  1. Агрегатна форма індексів. Середні арифметичні та гармонійні індекси, їх застосування.
  2. Аналіз і конструювання організації.
  3. Аналіз і конструювання робочого місця
  4. Армовані з'єднання. Розрахунок, конструювання
  5. Б) Розрахунок і конструювання баз з траверсою і баз з консольними ребрами.
  6. Питання 51. Ринкові індекси як макроекономічні індикатори фондового ринку. Види індексів.
  7. Гнутоклеєні рами. Конструювання і розрахунок.

Використання декількох індикаторів, як було показано вище, збільшує валідність і надійність вимірювання змінних. Тут, однак, виникає нова проблема: як використовувати отримані значення індикаторів для того, щоб охарактеризувати кожен «випадок» (кожного респондента, групу, країну і т. П.) одним числовим значенням, однозначно визначає його положення на одновимірному континуумі змінної-ознаки, для вимірювання якої ми використовували даний набір індикаторів. Іншими словами, потрібно здійснити зворотний перехід від набору значень емпіричних індикаторів, що описують кожну конкретну одиницю аналізу, до упорядкування всіх одиниць аналізу по осі цікавить нас змінної. Таке впорядкування і називається власне шкалою, мірою вираженості змінної-ознаки, а логіка переходу від набору можна побачити значень до шкальні значеннями називається моделлю шкалювання. Зауважимо відразу, що якийсь набір індикаторів-наприклад, набір оціночних шкал (див. Гл. 5) -Може використовуватися для вимірювання більш ніж однієї змінної, і, отже, дані про які спостерігаються значних цих індикаторів в принципі дозволяють упорядкувати «випадок» по декількох змінним , т. е. за кількома шкалами. Однак це вже завдання багатовимірний-ного шкалювання, ми ж поки обмежимося обговоренням одновимірних шкал і індексів.

Якщо повернутися до структурованої матриці даних «змінна х випадок» (див. С. 79), то можна побачити, що процедура конструювання шкали може бути описана і як процедура «стиснення» матриці даних, зменшення її розмірності. Припустимо, три рядки нашої матриці відповідають змін-ним-індикаторами «дохід», «рід занять» і «освіта». Ми включили ці індикатори в наше дослідження заради того, щоб охарактеризувати соціально-економічний статус кожного респондента, т. Е. Розташувати їх від низького статусу до високого. Якщо ми замість трьох рядків, відповідних доходу, освітою і професією, введемо в нашу матрицю даних одну рядок, що відображає стан кожного респондента на сконструйованій нами шкалою СЕС, розмірність матриці зменшиться. Однак спочатку нам потрібно вирішити, як об'єднати три значення-три рядки матриці-в одне, т. Е. Нам потрібно обрати модель шкалювання.

Нехай, скажімо, три рядки нашої матриці даних - це отримані якимось чином (тестування, опитування експертів і т. П.) Оцінки «життєрадісності», «енергійності» і «незалежності». Дослідник припускає, що ці три індикатори можуть бути використані для вимірювання важливою для його теорії змінної «сила Я». Все, що йому потрібно зробити-це вирішити, як перевести оцінки в рядках 1-3 в оцінки «сили Я» (Див. Рис. 12).

Найпростіший і очевидний спосіб-це підсумувати для кожного індивіда оцінки по кожному індикатору. Одержаний сумарний бал буде відображати індивідуальні відмінності в «силі Я», так як дозволить упорядкувати всіх респондентів від мінімального до максимального значення цієї змінної (в нашому прикладі - від 0 до 6 балів). Ще одна перевага підсумовування -


збільшення різниці індивідуальних значень. Дійсно, максимально можливе відмінність по первинним індикаторами становило 2 бали (від 0 до 2). У сумарному показнику різниця між індивідуальними значеннями може скласти б балів. Отже, сумарний бал-це більш «чуйний» і надійний інструмент для впорядкування і може бути названий шкалою в сенсі визначення, даного нами вище. Однак в соціології сумарні показники частіше називають індексами, щоб підкреслити їх єдине важлива відмінність від «великих» шкал. Індекс дозволяє ефективно «згорнути» інформацію, що містилася у вихідних індикаторах (питаннях, пунктах, тестах), однак від сумарного балу не можна повернутися до вихідної матриці, точніше, до того патерни відповідей, який стоїть за даним значенням індексу. Якщо сформулювати це коректніше, індекс не дозволяє враховувати відмінності в структурі відповідей респондентів. Якщо знову звернутися до малюнку 12, то можна помітити, що суб'єкти Л. М. та Ф. Ж. мають однаковий сумарний бал, рівний 4 (досить високе значення!). Але чи можна вважати несуттєвим ту обставину, що у Л. М. нульовий рівень незалежності, а Ф. Ж. отримав той же сумарний бал через нестачу оптимізму? Припустимо, навіть досить похмурий чоловік може мати значну «силою Я», але слід вважати настільки ж «сильним» того, хто легко піддається тиску оточення?

В принципі індекси безумовно застосовні в тих випадках, коли модель вимірювання (див. Вище) передбачає, що якась латентна, т. Е. Вимірюється безпосередньо змінна, може бути виміряна за допомогою сукупності якісно однорідних показників. У багатьох випадках відмінності в значущості, важливості окремих індикаторів можна врахувати за допомогою «зважування», перерахунку значень з урахуванням «ваги» кожного індикатора в латентній змінної. Так в прикладі з «силою Я» можна помножити все індивідуальні значення в рядку «незалежність» на 2, якщо прийняти припущення про те, що незалежність впливає на латентну змінну з дворазовим ефектом.

Економісти часто використовують індекси роздрібних цін, що відображають динаміку вартості життя. При цьому різні товарні групи, наприклад, мають неоднакове значення в споживчому бюджеті, -як, скажімо, хліб і делікатеси-враховуються з різними ваговими коефіцієнтами. Але і в цьому


випадку індекс залишається недосконалим типом шкали: емпірична інформація тут використовується лише для шкалювання відмінностей між суб'єктами (Або іншими одиницями аналізу), але не для шкалювання відмінностей між пунктами-відповідями (емпіричними індикаторами). Використовуючи «зважування», ми вводимо апріорні обмеження на впорядкування входять в індекс індикаторів, які не залежать від даних спостереження.

Своєрідним переходом між моделлю сумарного балу (індексу) і основними моделями шкалювання є шкала Р. Ликерта (Лайкерта). Вихідним матеріалом для її побудови служать оціночні шкали згоди-незгоди з судженнями, які висловлюють більш-менш «доброзичливу» установку (див. Розділ «Вибір формату для відповідей» в гл. 5). Кількість категорій ответа- «згоден», «цілком згоден» і т. П зазвичай варіює від двох до семи. Респондент отримує бал по кожному судженню в залежності від обраного ним відповіді. Присуджується даному відповіді бал в свою чергу визначається «доброзичливістю» відповіді по відношенню до вимірюваної установці (інтенсивністю згоди з судженням), т. Е. Відповіді також впорядковані на одновимірному континуумі (від вкрай негативної установки до вкрай позитивною). Бали, отримані за кожну відповідь, підсумовуються. Сумарний бал, отриманий індивідуумом, характеризує вже його власне становище на установчому континуумі (наприклад, «консерватор», «помірний консерватор», «помірний ліберал», «ліберал»). Відзначимо відразу, що ця ж модель шкалювання може використовуватися і для вимірювання мотивації або обізнаності (відповідно респондента просять оцінити ступінь важливості якогось об'єкта або сказати, вірно чи невірно визначене твердження). Для відбору списку суджень, що складають шкалу Ликерта, вихідний список висловлювань пред'являють репрезентативною вибіркою респондентів (так званої вибіркою стандартизації). В остаточний список потрапляють ті висловлювання, для яких були отримані високі оцінки надійності-узгодженості та валідності. Зазвичай використовують описані нами раніше методи оцінки надійності та валідності (коррелированность з сумарним балом, порівняння «крайніх груп» і т. П.).

Наведемо як приклад деякі висловлювання «Тесту для вимірювання художньо-естетичної потреби молоді»9 (В дужках дан ключ до кожного вислову, який показує, за яку відповідь присуджується бал):

1. Думаю, що цілком можна обійтися без спілкування з творами мистецтва (невірно).

2. Я не люблю віршів (невірно).

3. Я колекціоную записи класичної музики (вірно).

4. ................................................ ................................................

Шкалирование за описаною моделі дає ординальне рівень вимірювання.

Шкали соціальної дистанції Е. Богардуса-найстаріша модель соціологічного шкалювання, яка не втратила, однак, своєї популярності. Дослідник розробляє сукупність питань, що відображають різну ступінь близькості відносин з певною соціальною або етнічною групою, наприклад:

1. Чи згодні Ви, щоб хорвати жили з Вами в одному місті? 9 див .: Аванесов В. С. Указ. соч. М .: Наука, 1982. С. 57-60.


2. Чи згодні Ви жити по сусідству з хорватами?

3. Чи згодні Ви працювати в одному відділі (установі) з хорватом?

4. Чи дозволите Ви своєї дочки вийти заміж за хорвата?

Передбачається, що згода з кожним наступним затвердженням відображає перехід до чергової градації ординальне шкали установок-від меншої близькості до більшої. Істотним вимогою до обраної сукупності питань є їх змістовна валідність, іншими словами, тут необхідні експертні процедури, описані вище (див .: с. 118). Важливо також переконатися в обґрунтованості припущення про одномірності шкаліруемой змінної. Якщо в даних, отриманих при використанні шкал соціальної дистанції, зустрічаються «нелогічні» (так звані нешкаліруемие) індивідуальні патерни відповідей, причиною найчастіше буває вплив іншої змінної. Прикладом нешкаліруемого патерну відповідей може служити ситуація, коли респондент, негативно відповів на «слабкі» питання, несподівано погоджується з більш «сильними», які передбачають високий ступінь близькості (серед фахівців з соціологічним методам має ходіння відповідна жарт: якщо людина, що не бажає жити в одному місті з чорними, згоден видати свою дочку заміж за чорного, це не помилка вимірювання: просто він однаково ненавидить негрів і власну дочку).

Шкала равнокажущіхся інтервалів Л. Терстоуна дозволяє досягти більш високого рівня вимірювання установок, ніж ординальне. Вона являє собою цілий клас методів інтервального шкалювання і буде розглянута тут як найбільш простий приклад10.

Перша шкала равнокажущіхся інтервалів була описана в роботі 1929 року і призначалася для вимірювання зупинок по відношенню до церкви як соціального інституту ". Цією роботою ми скористаємося для того, щоб проілюструвати основні етапи запропонованої Терстоуном процедури.

Шкала Терстоуна дозволяє розташувати і судження, і індивідів уздовж одновимірного континууму установки, полюсів якого відповідає вкрай доброзичливе і вкрай негативне ставлення до об'єкта установки (церкви, партії, прогресивному оподаткуванню або чого-небудь ще). Шкальний бал судження або індивіда відображає ступінь цієї доброзичливості або недоброзичливі.

На першому етапі дослідник складає максимально широкий список суджень (висловлювань), що виражають потрібну йому установку. Так, Тер-стоун збирав думки колег, студентів, висловлювання з публікацій, що стосуються церкви. Тут доречні також інтерв'ювання, використання відкритих питань ( «Що Ви думаєте про ...?»), Групова дискусія і т. П. Зібрані судження були піддані первинного відбору. Дослідники відсіяли ті висловлювання, які не задовольняли звичайним вимогам до конструювання

10 Тих, хто хоче дізнатися більше про різні методи шкалювання і готовий подолати труднощі, пов'язані з використанням деяких статистичних понять, ми можемо відіслати до оглядових робіт, що містить також необхідну бібліографію:

Грін Б. Ф. Вимірювання установки // Математичні методи в сучасній буржуазній соціології. М .: Прогрес, 1966. С. 227-228; Дев'ятко І. Ф. Указ. соч. " Thurstone L. L., Chave E. F. The Measurement of Attitudes. A Psychophysical Method and Some Experiments with a Scale for Measuring Attitude toward Church. 7th ed. Chicago:

University of Chicago Press, [1929] 1964.


ню питань - двозначні, занадто довгі, містять спеціальні терміни і т. п. (див. гл. 5). При первинному відборі суджень для шкали Терсто-уна використовують і деякі спеціальні критерії:

1. Виключаються судження, що стосуються радше до минулого, ніж до цього (наприклад, «В середньовіччі церква відігравала важливу роль в суспільному житті»).

2. Виключаються судження, що описують факти, а думки і відносини. Звичайно, далеко не завжди можна відокремити висловлювання, що описують фактичний стан справ, від інших. Скажімо, слова «Бог любить нас усіх» - факт для віруючого, хоча інші люди можуть угледіти в них певне ставлення до релігії. У практичних цілях цілком достатньо керуватися наступним критерієм для виявлення фактичних суджень, які підлягають усуненню з шкали Терстоуна: фактом є будь-яке висловлювання, для встановлення істинності якого можуть бути використані якісь «поцюстороння» процедури верифікації.

3. Виключаються також судження, що містять слова «все», «завжди», «ніхто», «ніколи», так як цим словам люди зазвичай надають різний зміст, що ускладнює інтерпретацію.

В результаті вихідний список з 350-400 суджень скорочується до 100-120.

Наступним етапом є «Суддівська» процедура, що дозволяє визначити шкальної значення для кожного судження і провести серед них остаточний відбір. Терстоун запропонував розділити гіпотетичний континуум доброзичливого-недоброзичливі відносини до церкви на 11 категорій (від «А» до «К»), розділених суб'єктивно рівними інтервалами. Вимога суб'єктивного рівності інтервалів між градаціями має велике значення для побудови шкали Терстоуна і зазвичай його спеціально підкреслюють в інструкції для «суддів» (наприклад, «Уявіть, що картки з буквами від" А "до" К "представляють розташовані на рівній відстані градації шкали, так що градації "А" відповідає максимально доброзичливе-відношення до Х (Об'єкта установки), а "К" -максимально недоброзичливі, негативне ставлення »). Кожне із тверджень списку друкується на окремій картці, які і лунають «суддям» (в конструюванні шкали установок по відношенню до церкви брало участь 300 таких експертів). Завдання «суддів» полягає в тому, щоб розкласти все 100-120 суджень по 11 рубриках соответствен-но ступеня вираженого в них доброзичливого або недоброзичливі відносини до об'єкту зупинки.

Підкреслимо, що «суддів» не просять висловити їх власну думку, вони повинні лише розсортувати висловлювання.

Шкальної значення (бал) кожного з висловлювань визначається розподілом оцінок «суддів», тому початком наступного етапу (власне побудови шкали) є підрахунок відсотка експертів, які поклали висловлювання в певну стопку. Далі підраховується сумарний (кумулятивний) відсоток «суддів», які віднесли судження до даної градації і попереднім градаціях. Терстоун привласнював використовувалися градаціях числові значення від 1 (градація «А», максимально доброзичливе ставлення до церкви) до 11 (градація «К»). Проілюструємо подальше на прикладі гіпотетичного судження N, дані для якого представлені в таблиці 6.1.


 Таблиця 6.1 Розподіл «суддівських» оцінок для судження N
 Градація (числове значення)  «А» (1)  "В 2)  «С» (3)  «D» (4)  «Е» (5)  «F» (6)  «G» (7)  «Н» (8)  «I» (9)  «J» (10)  «К» (11)
 Відсоток суддів, які віднесли судження до даної градації
 кумулятивний відсоток

Розподіл кумулятивних (накопичених) відсотків дозволяє обчислити значення медіани і междуквартільного розмаху. Медіана, або процентиль 50 в розподілі накопичених частот, - це таке значення на шкалі «А» - «К», щодо якого половина суддів дала великі, а інша половина- менші оцінки даного твердження12. Медіана, таким чином, ділить навпіл впорядкована множина значень ознаки. Обчислити медіану ми можемо за такою формулою:

У методі Терстоуна ширина інтервалу між сусідніми чисельними градаціями за визначенням дорівнює 1 (равнокажущіеся інтервали). У використовуваному нами прикладі межами інтервалу, де розташована медіана (процентиль 50), є градації «F» і «G» (див. табл. 6.1). Фактичною нижньою межею інтервалу медіани буде значення 6,5 13, Звідси:

Значення медіани і приймається за шкальний бал ( «ціну») судження. Для гіпотетичного судження nb нашому прикладі він виявився дорівнює 6,7. (В принципі простішим є графічний метод знаходження медіани. Для цього на міліметрівці будується крива накопичених відсотків - огива, що дозволяє легко знайти числове значення, відповідне проценти-лю 50.)

Ясно, однак, що не всі судження, які отримали оцінку «суддів», в рівній мірі придатні для шкали: деякі з міркувань отримають досить узгоджені і

12 Більш повне уявлення про медіані як міру центральної тенденції і межквар-тільном розмаху як міру розкиду чисельних значень ознаки при необхідності можна отримати з будь-якого підручника з основ прикладної статистики. Див., Наприклад: Глас Дж., Стенлі Дж. Статистичні методи в педагогіці і психології. М .: Прогрес, 1976. Гл. 4, 5. Див. Також гл. 8 цього видання.

13 Фактичні межі інтервалів при побудові гістограм або полігонів розподілу частот задають таким чином, щоб числове значення випадає на даний інтервал градації шкали виявилося - з урахуванням прийнятого способу округлення-в середині інтервалу (так, для градації 3 фактичні межі можуть скласти 2,5 і 3, 5). Більш докладні відомості про правила групування значень змінної і графічного представлення отриманого розподілу частот можна знайти у відповідних розділах будь-якого підручника з основ прикладної статистики.


одностайні оцінки експертів, тоді як інші викличуть різнобій у думках. Для оцінки внутрішньої узгодженості окремих висловлювань шкали Терстоуна застосував міру розкиду суддівських оцінок - междуквартільний розмах. (Тут знову замість розподілу абсолютних частот експертних оцінок використовується розподіл процентилей, т. Е. Накопичені частоти висловлюють в кумулятивних відсотках, що дозволяє порівнювати вибірки різного об'єму.) Междуквартільний розмах-це відстань між першим і третім Квартиль розподілу. перший квартиль (Q1) задається точкою на осі, до якої лежить 25% отриманих оцінок судження, а третій (Q3) - точкою, вище якої лежить 25% оцінок. (Легко бачити, що другого Квартиль відповідає медіана.) Для обчислення междуквартільного розмаху (Q3 - Q1) спочатку встановлюються значення, що відповідають першому і третьому Квартиль розподілу. Для цього використовуються формули, аналогічні формулі для медіани, з відповідними поправками: береться фактична нижня межа інтервалу відповідного квартиля, кумулятивний відсоток для нижньої межі інтервалу даного квартиля і т. Д. Так, для першого квартиля формула підрахунку така:

Читач може самостійно виписати аналогічну формулу для третього квартиля (75 процентиль), провести необхідні підрахунки і переконатися, що для вигаданого судження ^ междуквартільний розмах (Q3-Q1) Складе 1,7.

Ті судження, для яких розкид оцінок, виміряний через междуквартільний розмах, виявляється занадто великий, виключаються з шкали Терстоуна. Передбачається, що висловлювання, яке отримало настільки різні оцінки, сприймається занадто неоднозначно. Так, Терстоун виключив з спочатку пред'явленого «суддям» списку 90 висловлювань з 130. У результуючої шкалою залишають одне-два висловлювання для кожного ділення шкали, щоб все градації передбачуваного установочного континууму виявилися рівною мірою представлені.

Якщо вийшла шкалу пред'явити тепер групі респондентів, то індивідуальним балом кожного суб'єкта, що виражає міру «доброзичливості» його установки, можна вважати медіану (або середній бал) всіх суджень, з якими він погодився.

Багато критиків шкали Терстоуна вказували на можливість впливу на отримані результати характеристик «суддівської» групи і широти діапазону пропонованих суджень14. Все ж існують вагомі підстави вважати, що

14 Додаткові відомості про критику шкали Терстоуна, а також про інші методи відсіву іррелевантние даних см., Зокрема: Клігера С. А., клишоногість М. С., Толсто-ва Ю. М. Шкалирование при зборі та аналізі соціологічної інформації. М .: Наука, 1978. Гл. 3; Дев'ятко І. Ф. Указ. соч.


така шкала має цілком задовільною відтворюваністю і в середньому діапазоні дає рівень вимірювання, що перевершує ординальне (є так званої шкалою різниць). Видалення або додавання пункту шкали не змінює шкальних значень інших пунктів-висловлювань. Наведемо деякі приклади висловлювань, включених Терстоуном в остаточний варіант шкали установок по відношенню до церкви (в дужках вказано шкальний бал судження):

- «Я думаю, що церква - це найважливіший соціальний інститут в сучасній Америці» (0,2);

- «Коли я перебуваю в храмі, мені приносить задоволення спостерігати за службою, особливо якщо при цьому звучить гарна музика» (4,0);

- «Я відчуваю потребу в якійсь релігії, але не знаходжу того, що мені потрібно, ні в одній з існуючих церков» (6,1);

- «З моєї точки зору, церква безнадійно застаріла» (9,1).

В основі шкали Гутмана також лежить ідея кумулятивности: одні висловлювання-пункти мають велику «навантаження» на одновимірному континуумі шкаліруемой змінної-ознаки, інші-меншу. Модель шкалювання, запропонована Гутманом, має на увазі, що в ідеальному випадку респондент, який погодився з більш «навантаженим» пунктом, погодиться і з усіма менш «навантаженими». Таким чином, знання максимального шкального бала респондента дозволяє повністю відтворити патерн його відповідей. Шкаліруемая змінна-ознака не обов'язково є установкою, вона може характеризувати поведінку: одна з перших гутмановскіх шкал, наприклад, містила пункти, що описують симптоми реактивного неврозу, -розлади сну, нудота, страх і т. П.15 У запропонованій Гутманом процедурі зазвичай використовується сукупність дихотомічних питань, т. Е. Питань, на які можуть бути подані лише дві відповіді: «так» або «ні», «згоден» або «не згоден». Сукупність питань або тверджень, що складають гутмановскую шкалу, повинна володіти одним істотним властивістю: ймовірність позитивної відповіді монотонно зростає зі зростанням значення шкаліруемой (латентної) змінної. Звідси випливає, що суб'єкти, які мають більший шкальний бал, т. Е. Більше значення латентної змінної, з більшою ймовірністю дають позитивну відповідь на кожен окремий питання16. Ця умова легко проілюструвати на прикладі наступних питань про зростання (для простоти викладу припустимо, що похибка вимірювання відсутня, т. Е. Все респонденти знають і точно повідомляють свій істинний зростання):

1. Чи вірно, що Ваш зростання перевищує 1,50 м?

2. Чи правда, що Ваш зростання перевищує 1,60 м?

3. Чи правда, що Ваш зростання перевищує 1,70 м? Ці питання утворюють ідеальну гутмановскую шкалу: якщо помилка вимірювання відсутня, будь-який респондент, який відповів позитивно на питання 3, дасть

15 Приклади шкал, розроблених Л. Гутманом і його співробітниками, можна знайти в класичній праці: Stouffer S. A. et al. Measurement and Prediction. N. Y .: John Wiley & Sons, [1950] 1966.

16 У більш строгому формулюванні: логічна форма питання (судження) повинна припускати, що ймовірність прийняття судження є монотонно зростаючою (або зменшенням) функцією шкальної позиції респондента.


 Таблиця 6.2 Відповіді на питання про зростання для чотирьох гіпотетичних респондентів
 Питання, № п / п Респондент
А + + +
Б + + -
В + - -
Г - - -

позитивну відповідь і на питання 2 і 1. Взагалі, знаючи максимальний бал респондента, ми можемо повністю відтворити його патерн відповідей. Для питань про зростання всіх можливих патерни відповідей (Шкільні типи) наведені в табл. 6.2.

Якщо респондентів і питання розташувати на одній шкалі латентної змінної (в даному випадку, «зростання»), то стане очевидним, що респонденти реагують на питання в залежності від свого рангу (положення) на цій же шкалі: респондент даного зростання, позитивно прореагував на якийсь питання-пункт, буде також позитивно реагувати на всі пункти, що мають нижчий ранг (у нашому прикладі, на все більш «низькорослі» питання-пункти). Скажімо, для прикладу з ростом спільне впорядкування питань і респондентів на гутмановской шкалою могло б виглядати, як на малюнку 13.

Легко бачити, що в нашому прикладі найбільш «популярними» (що мають найбільшу частоту позитивних відповідей) будуть менш «навантажені» по шкаліруемой змінної питання. З іншого боку, більша кількість позитивних відповідей буде у тих респондентів, для яких значення шкаліруемой змінної вище.

Для того щоб визначити, чи є дана сукупність питань шкаліруемой, т. Е. Дає вона добре наближення до ідеальної моделі шкалювання по Гутманн, потрібно, по-перше, переконатися, що питання за своїм змістом можуть відповідати вищеописаного умові монотонного зростання ймовірності позитивної відповіді . Так, наприклад, розглянуті вище питання шкали соціальної дистанції Богардуса теоретично можуть скласти гутмановскую шкалу. Однак так звані точкові питання - наприклад:

«Чи правда, що Ваш зріст дорівнює 1,65 м?» - Напевно не можуть бути використані в рамках даної шкальної моделі. Подальша процедура побудови гутмановской шкали полягає в перевірці відповідності реальних даних моделі досконалої шкали Гутмана і її краще розглянути на конкретному прикладі.


Припустимо, якийсь соціолог намагається виміряти змінну «благопристойність», яку він чомусь пов'язує з прагненням слідувати нормативними приписами, які регулюють публічне (т. Е. Безособове) соціальне спілкування. Серед використаних ним питань є три наступних:

1. Ви зазвичай стукайте в двері кабінету або кімнати, перш ніж увійти (вірно, невірно).

2. У публічних обговореннях або дискусіях Ви висловлюєте свою думку лише тоді, коли Вас прямо про це попросять (вірно, невірно).

3. Ви надасте перевагу промовчати, якщо Вам здасться, що Ваше справедливе і суттєве зауваження може викликати роздратування у оточуючих (вірно, невірно).

Звичайно, можна припустити, що деякі з винайдених дослідником питань відображають скоріше «соціальну тривожність» або «конформізм», але в даному випадку ми будемо керуватися тим, що ідеальних індикаторів не буває: бувають індикатори, що дають краще або гірше наближення до ідеальної шкалою для реальних даних.

Отже, соціологу потрібно перевірити, наскільки отримана ним емпіричний розподіл відповідей відповідає тим теоретично можливим паттернам відповідей на три питання, які в таблиці 6.2 утворюють бездоганний «паралелограм», характерний для ідеальної гутмановской шкали. Для випадку трьох питань можливі чотири «правильних» патерну відповідей, що позначаються звичайно як шкільні типи відповідей:

1. +++

2. ++ -

3. + -

4 .---

Припустимо, що наш соціолог отримав наступну картину розподілу шкальних типів (див. табл. 6.3).

Судячи з таблиці 6.3, апріорне впорядкування питань збіглося з реальним:

самий «легкий» перше питання виявився і найпопулярнішим (див. вище), тоді як на самий «важкий» питання шкали позитивно відповіли лише 30 опитаних: небажання висловлювати свою точку зору вимагає значно більшої кількості «благопристойності», ніж звичка стукати в двері.

 Таблиця 6.3 Розподіл відповідей для шкальних типів
 питання Відповіді  Питання 1 ( «стук у двері»)  Питання 2 ( «публічна дискусія»)  Питання 3 ( «побоювання викликати роздратування»)  Число випадків, N
 Патерн відповіді ( «+» - «вірно», «-» - «невірно»): + + +
+ + -
+ - -
- - -
   всього 135

Якби використаний нами вихідний порядок питань не збігся б з їх реальним ранжированием за кількістю позитивних відповідей, то це саме по собі не доводило б «нешкаліруемості» даної сукупності пунктів: для того, щоб отримати таку ж красиву «гутмановскую» картину розподілу відповідей, як в попередній таблиці 6.2, було б досить просто переставити стовпчики таблиці так, щоб першим виявився найпопулярніше питання з найбільшим числом позитивних відповідей і т. д. (Впорядковану таким чином таблицю зазвичай називають шкалограммной матрицею, або шкалог-Рамі.)

Реальною проблемою в нашому прикладі, як і в більшості випадків побудови гутмановской шкали, стала наявність так званих нешкальних типів, т. е. таких патернів відповіді, які просто не вкладаються в логіку одновимірної моделі з монотонно зростаючою ймовірністю відповіді. Прикладом «нешкального» патерну міг би бути позитивний відповідь на третє питання при негативних відповідях на перші два питання (- - +). Та обставина, що якийсь респондент, безцеремонно входить в чужу двері без стуку, боїться відкрито висловити свою думку, може бути і випадковою помилкою, і результатом впливу якоїсь сторонньої змінної: можливо, відповідаючи на третє питання, ця людина думав не про хороші манери , а про те, що висловлювати свою думку відкрито в його звичному середовищі «невигідно», недалекоглядно і т. п. Для того щоб перевірити шкальну гіпотезу про те, що дана сукупність питань дає хороше наближення до гутмановской шкалою, нам слід трактувати «нешкальние» типи відповіді як помилки і оцінити, наскільки велике відхилення від ідеальної моделі. Нехай наш дослідник отримав наступний розподіл «нешкальних» типів (див. табл. 6.4).

Розумно припустити, що «нешкальний» тип - - + можна віднести до шкально-го типу - - - з однією помилкою. Другий «нешкальний» патерн відповіді - ++ можна розглядати як відхилення від шкільного типу + + + також з однією помилкою (якби ми віднесли цей «нешкальний» патерн до типу - - -, то помилок було б дві, а не одна). Існують різні способи оцінки прийнятності спостережуваних відхилень від досконалої шкали, містить лише шкали-ні патерни відповіді. Тут ми скористаємося найпростішим і грубим, розрахувавши коефіцієнт відтворюваності шкали Rep (Від англ. Reproducibility) за такою формулою:

У нашому прикладі ми, ґрунтуючись на ідеальної моделі шкали, можемо відтворити (передбачити) по три відповіді для 143 респондентів. Всього ми зробимо

 Таблиця 6.4 Розподіл відповідей для «нешкальних» типів
 питання Відповіді  Питання 1 ( «стук у двері»)  Питання 2 ( «публічна дискусія»)  Питання 3 ( «побоювання викликати роздратування»)  число випадків
 Патерн відповіді: - - +
- + -
   всього 8

429 пророкувань для окремих відповідей. З них 8 відповідей виявляться помилковими (кожна помилка буде відрізнятися від очікуваної відповіді тільки на 1 бал). Коефіцієнт відтворюваності складе, таким чином, 0,98 (або 98%).

На практиці прийнято вважати прийнятним будь-яке значення коефіцієнта відтворюваності, яке перевищує 0,90 (90%). Очевидно, що 100% -й воспроизводимостью може володіти лише досконала гутмановская шкала.

Якщо отримане значення коефіцієнта відтворюваності перевершує заданий поріг, дана сукупність питань може використовуватися в якості шкали Гутмана. При цьому питань присвоюються шкальні значення, що відображають їх ранжування за шкалою (скажімо, 1, 2 і 3), так що самий «легкий» питання отримує найнижчий бал. Респонденти отримують індивідуальний бал, відповідний їх шкальні типам (число позитивних відповідей або сумарний бал).

Слід пам'ятати про те, що отримана шкала відображає наявність певної впорядкованості в тій матриці реальних даних, для яких перевірялася гутмановская модель. Іншими словами, висновок про те, що дана сукупність питань становить шкалу Гутмана, вірний для даної вибірки і для даної серії спостережень. Перенесення шкали з однієї популяції на іншу вимагає нових даних і нового обгрунтування.

Ми розглянули лише деякі, щодо прості, методи конструювання індексів і шкал в соціології. Проаналізовані нами приклади підтверджують корисність шкал для підвищення якості соціологічного виміру (т. Е. Його надійності та валідності) і для економного уявлення емпіричної інформації, одержуваної в ході дослідження. Нарешті, аналіз моделей вимірювання, що лежать в основі будь-якої шкали, часто допомагає прояснити природу теоретичних понять і взаємозв'язків між ними. Ще одним кроком до змістовних і заснованим на реальних емпіричних спостереженнях висновків є аналіз даних.

Основам аналізу даних присвячена глава 8.

додаткова література

Аванесов В. С. Тести в соціологічному дослідженні. М .: Наука, 1982.

Грін Б. Ф. Вимірювання установки // Математичні методи в сові-ною буржуазної соціології. М .: Прогрес, 1966.

Дев'ятко І. Ф. Діагностична процедура в соціології: нарис історії та теорії. М .: Наука, 1993.

Клігера С. А., клишоногість М. С., Толстова Ю. Н. Шкалирование при зборі та аналізі соціологічної інформації. М .: Наука, 1978.

 Остов Г. В., Андрєєв Е. П. Методи вимірювання в соціології. М .:

Наука, 1977.

Толстова Ю. Н. Логіка математичного аналізу соціологічних даних. М .: Наука, 1991.

Отрут В. А. Соціологічне дослідження: методологія, програма, методи. 2-е изд. М .: Наука, 1987. Гл. 3.



Надійність і валідність вимірювання | МОДЕЛІ ДОСЛІДЖЕННЯ ОПЕРАЦІЙ
© um.co.ua - учбові матеріали та реферати