На головну

ПРО РОЗРОБКУ РЕГЛАМЕНТУ ПРОВЕДЕННЯ ЗБОРУ ТА АНАЛІЗУ експертних ДУМОК

  1. A) Інтенсивність поляризованого світла, що пройшло через аналізатор, прямо пропорційна квадрату кута між дозволеними напрямками поляризатора і аналізатора
  2. I. Обгрунтування необхідності проведення масові обстежень пасажиропотоків і їх організаційне забезпечення.
  3. II. Строки і місце проведення фестивалю
  4. II. Перелік питань для проведення перевірки знань кандидата на отримання свідоцтва приватного пілота з внесенням кваліфікаційної відмітки про вид повітряного судна - вертоліт
  5. II. Порядок проведення атестації
  6. III ЕТАП: РЕЗУЛЬТАТИ АНАЛІЗУ
  7. III. Умови та порядок проведення конференції

Існує маса методів отримання експертних оцінок. В одних з кожним експертом працюють окремо, він навіть не знає, хто ще є експертом, а тому висловлює свою думку незалежно від авторитетів, "кланів" і окремих колег. В інших експертів збирають разом для підготовки матеріалів для ОПР, при цьому експерти обговорюють проблему один з одним, приймають чи відкидають аргументи один одного, вчаться один у одного, і невірні або недостатньо обгрунтовані думки відкидаються. В одних методах число експертів фіксоване і таке, щоб статистичні методи перевірки узгодженості думок і потім (в разі досить хорошою узгодженості думок) їх усереднення дозволяли приймати обгрунтовані рішення з точки зору економетрики. В інших - число експертів росте в процесі проведення експертизи, наприклад, при використанні методу "сніжної грудки" для формування команди експертів.

В даний час не існує загальноприйнятою науково обґрунтованої класифікації методів експертних оцінок і тим більше - однозначних рекомендацій щодо їх застосування. Спроба силою затвердити одну з можливих точок зору може принести лише шкоду.

Однак для розповіді про різноманіття експертних оцінок необхідна будь-яка робоча класифікація методів. Одну з таких можливих класифікацій ми даємо нижче, перераховуючи підстави, за якими ми ділимо експертні оцінки.

Один з основних питань - що саме має представити експертна комісія в результаті своєї роботи - інформацію для прийняття рішення ОПР або проект самого рішення? Від відповіді на це методологічний питання залежить організація роботи експертної комісії, і вона є першим підставою для розбиття методів.

МЕТА - ЗБІР ІНФОРМАЦІЇ ДЛЯ ЛПР. Тоді Робочу групу повинна зібрати щонайбільше, що стосується справи, аргументів "за" і "проти" певних варіантів рішень. Корисний наступний метод поступового збільшення числа експертів. Спочатку перший експерт наводить свої міркування з даного питання. Складений ним матеріал передається другому експерту, який додає свої аргументи. Накопичений матеріал надходить до наступного - третього - експерту ... Процедура закінчується, коли вичерпується потік нових міркувань.

Відзначимо, що експерти в розглянутому методі тільки постачають інформацію, аргументи "за" і "проти", але не виробляють узгодженого проекту рішення. Немає ніякої необхідності прагнути до того, щоб експертні думки були узгоджені між собою. Більш того, найбільшу користь приносять експерти з мисленням, що відхиляється від масового. Саме від них слід очікувати найбільш оригінальних аргументів.

МЕТА - ПІДГОТОВКА ПРОЕКТУ РІШЕННЯ ДЛЯ ЛПР. Математичні методи в експертних оцінках застосовуються зазвичай саме для вирішення завдань, пов'язаних з підготовкою проекту рішення. При цьому найчастіше некритично приймають догми узгодженості і одномірності. Ці догми "кочують" з однієї публікації в іншу, тому доцільно їх обговорити.

ДОГМА УЗГОДЖЕНІСТЬ. Часто без всяких підстав вважається, що рішення може бути прийнято лише на основі узгоджених думок експертів. Тому виключають з експертної групи тих, чия думка відрізняється від думки більшості. При цьому відкидаються як некваліфіковані особи, що потрапили до складу експертної комісії з непорозуміння чи з міркувань, які не мають відношення до їх професійного рівня, так і найбільш оригінальні мислителі, глибше проникли в проблему, ніж більшість. Варто було б з'ясувати їхні аргументи, надати їм можливість для обгрунтування їх точок зору. Замість цього їх думкою нехтують.

Буває і так, що експерти діляться на дві або більше груп, що мають єдині групові точки зору. Так, відомий приклад поділу фахівців при оцінці результатів науково-дослідних робіт на дві групи: "теоретиків", явно віддають перевагу НДР, у яких отримані теоретичні результати, і "практиків", що вибирають ті НДР, які дозволяють отримувати безпосередні прикладні результати (мова йде про конкурсі НДР в академічному Інституті проблем управління (автоматики і телемеханіки)). Іноді заявляють, що в разі виявлення двох або кількох груп експертів опитування не досяг мети. Це не так! Мета досягнута - встановлено, що єдиної думки немає. Це дуже важливо. І ЛПР при прийнятті рішень повинен це враховувати. Прагнення забезпечити узгодженість думок експертів будь цілої може приводити до свідомого одностороннього підбору експертів, ігнорування всіх точок зору, крім однієї, найбільш "полюбилася" Робочій групі (або навіть "підказаної" ЛПР).

Часто не враховують ще одного чисто економетричного обставини. Оскільки число експертів зазвичай не перевищує 20-30, то формальна статистична узгодженість думок експертів (встановлена ??за допомогою тих чи інших критеріїв перевірки статистичних гіпотез) може поєднуватися з реально існуючим поділом експертів на групи, що робить подальші розрахунки не мають відношення до дійсності. Для прикладу звернемося до конкретних методів розрахунків за допомогою коефіцієнтів конкордації на основі коефіцієнтів рангової кореляції Кендалла або Спірмена. Необхідно нагадати, що відповідно до економетричної теорії позитивний результат перевірки узгодженості у такий спосіб означає ні більше, ні менше, як відхилення гіпотези про незалежність і рівномірної розподіленості думок експертів на множині всіх ранжировок. Таким чином, перевіряється нульова гіпотеза, згідно з якою ранжування, що описують думки експертів, є незалежними випадковими бінарними відносинами, рівномірно розподіленими на безлічі всіх ранжировок. Відхилення цієї нульової гіпотези тлумачиться як узгодженість відповідей експертів. Іншими словами, ми падаємо жертвою помилок, що випливають із своєрідного тлумачення слів: перевірка узгодженості в зазначеному математико-статистичному сенсі зовсім не є перевіркою узгодженості в сенсі практики експертних оцінок. (Саме ущербність що розглядаються математико-статистичних методів аналізу ранжировок привела групу фахівців до розробки нового економетричного апарату для перевірки узгодженості - непараметричних методів, заснованих на т. Зв. люсіанов і входять до сучасний розділ економетрики - статистику нечислових даних). Групи експертів з близькими методами можна виділити економетричними методами кластер-аналізу.

ДУМКИ Дисиденти. З метою штучно домогтися узгодженості намагаються зменшити вплив думок експертів-дисидентів, Т. Е. Інакомислячих в порівнянні з більшістю. жорсткий спосіб боротьби з дисидентами полягає в ігноруванні їх думок, т. е. фактично в їх виключення зі складу експертної комісії. Відбраковування експертів, як і відбраковування різко виділяються результатів спостережень (викидів), призводить до процедур, які мають погані або невідомі статистичні властивості. Так, відома крайня нестійкість класичних методів відбракування викидів по відношенню до відхилень від передумов моделі. м'який спосіб боротьби з дисидентами полягає в застосуванні робастних (стійких) статистичних процедур. Найпростіший приклад: якщо відповідь експерта - дійсне число, то різко виділяється думку дисидента сильно впливає на середнє арифметичне відповідей експертів і не впливає на їх медіану. Тому розумно як узгодженого думки розглядати медіану. Однак при цьому ігноруються (не досягають ОПР) аргументи дисидентів. У будь-якому з двох способів боротьби з дисидентами ЛПР позбавляється інформації, що йде від дисидентів, а тому може прийняти необгрунтоване рішення, яке згодом призведе до негативних наслідків. З іншого боку, уявлення ОПР всього набору думок знімає частину відповідальності і праці з підготовки остаточного рішення з комісії експертів і робочої групи з проведення експертного опитування і перекладає ці відповідальність і праця на плечі ОПР.

ДОГМА одномірні. Поширений досить примітивний підхід, згідно з яким об'єкт експертизи завжди можна оцінити одним числом. Дивна ідея! Оцінювати людини одним числом спадало на думку лише на невільничих ринках. Навряд чи навіть найзавзятіші кваліметрісти розглядають книгу або картину як еквівалент числа - її "ринкової вартості".

Разом з тим не можна повністю заперечувати саму ідею пошуку узагальнених показників якості, технічного рівня і аналогічних. Так, кожен об'єкт можна оцінювати за багатьма показниками якості. Наприклад, легковий автомобіль можна оцінювати за такими показниками: витрата бензину на 100 км шляху (в середньому); надійність (середня вартість ремонту за рік); екологічна безпека, оцінювана по вмісту шкідливих речовин у вихлопних газах; маневреність; швидкість набору швидкості 100 км / год після початку руху; максимальна досягається швидкість; тривалість збереження в салоні позитивної температури при низькій зовнішній температурі (-50 градусів за Цельсієм) і вимкненому двигуні; дизайн (привабливість і "модність" зовнішнього вигляду та оздоблення салону); вага, і т. д. Чи можна звести оцінки за цими показниками разом? Визначальною є конкретна ситуація, для якої вибирається автомашина. Максимально що досягається швидкість важлива для гонщика, але, як нам видається, не має великого практичного значення для водія рядовий приватної машини, особливо в місті з суворим обмеженням на максимальну швидкість. Для такого водія важливіше витрата бензину, маневреність і надійність. Для машин різних державних служб, мабуть, надійність важливіше, ніж для приватника, а витрата бензину - навпаки. Для районів Крайньої Півночі важлива теплоізоляція салону, а для південних районів - немає. І т. Д. Таким чином, важлива конкретна (вузька) постановка завдання перед експертами. Але такої постановки часто немає. А тоді "гри" по розробці узагальненого показника якості - наприклад, у вигляді лінійної функції від перерахованих змінних - не можуть дати об'єктивних висновків. Альтернативою єдиному узагальненому показнику є математичний апарат типу багатокритеріальної оптимізації - Безлічі Парето і т. Д.

У деяких випадках все-таки можна глобально порівняти об'єкти - наприклад, за допомогою тих же експертів отримати впорядкування розглянутих об'єктів - виробів чи проектів. Тоді можна ПІДІБРАТИ коефіцієнти при окремих показниках так, щоб впорядкування за допомогою лінійної функції якомога точніше відповідало глобальному впорядкування (Наприклад, знайти ці коефіцієнти методом найменших квадратів). Навпаки, в подібних випадках НЕ СЛІД оцінювати зазначені коефіцієнти за допомогою експертів. Ця проста ідея досі не стала очевидною для окремих укладачів методик з проведення експертних опитувань та аналізу їх результатів. Вони наполегливо намагаються змусити експертів робити те, що вони виконати не в змозі - Вказувати ваги, з якими окремі показники якості повинні входити в підсумковий узагальнений показник. Експерти зазвичай можуть порівняти об'єкти або проекти в цілому, але не можуть виокремити внесок окремих факторів. Раз організатори опитування запитують, експерти відповідають, але ці відповіді не несуть в собі надійної інформації про реальність ...

ДРУГЕ ЗАСНУВАННЯ КЛАСИФІКАЦІЇ експертних ПРОЦЕДУР - ЧИСЛО ТУРОВ. Експертизи можуть включати один тур, деяке фіксоване число турів (два, три, ...) або невизначене число турів. Чим більше турів, тим більш ретельно є аналіз ситуації, оскільки експерти при цьому зазвичай багато разів повертаються до розгляду предмета експертизи. Але одночасно збільшується загальний час на експертизу і зростає її вартість. Можна зменшити витрати, вводячи в експертизу не всіх експертів відразу, а поступово. Так, наприклад, якщо мета полягає в зборі аргументів "за" і "проти", то початковий перелік аргументів може бути складений одним експертом. Другий додасть до нього свої аргументи. Сумарний матеріал надійде до першого і третього, які внесуть свої аргументи і контраргументи. І так далі - додається по одному експерту на кожен новий тур. Найбільші труднощі викликають процедури з заздалегідь невизначеним числом турів, наприклад, "снігова куля". Часто задають максимально можливе число турів, і тоді невизначеність зводиться до того, чи доведеться проводити це максимальне число турів або вдасться обмежитися меншим числом.

ТРЕТЄ ЗАСНУВАННЯ КЛАСИФІКАЦІЇ експертних ПРОЦЕДУР - ОРГАНІЗАЦІЯ СПІЛКУВАННЯ ЕКСПЕРТІВ. Розглянемо переваги і недоліки кожного з елементів шкали: відсутність спілкування - заочне анонімне спілкування - заочне спілкування без анонімності - очне спілкування з обмеженнями - очне спілкування без обмежень. При відсутності спілкування експерт висловлює свою думку, нічого не знаючи про інших експертів і про їх думках. Він повністю незалежний, що і добре, і погано. Зазвичай така ситуація відповідає однотуровой експертизі. Заочне анонімне спілкування, Наприклад, як в методі Дельфі, означає, що експерт знайомиться з думками і аргументами інших експертів, але не знає, хто саме висловив те чи інше положення. Отже, в експертизі має бути передбачено хоча б два тури. Заочне спілкування без анонімності відповідає, наприклад, спілкування по Інтернету. Всі варіанти заочної експертизи хороші тим, що немає необхідності збирати експертів разом, отже, знаходити для цього слушний час і місце. При очних експертизах експерти кажуть, а не пишуть, як при заочних, і тому встигають за той же час сказати значно більше. Очна експертиза з обмеженнями вельми поширена. Це - збори, що йде по фіксованому регламенту. Прикладом є військова рада в імператорської російської армії, коли експерти (офіцери і генерали) висловлювалися в порядку від молодшого (по чину і посади) до старшого. нарешті, очна експертиза без обмежень - Це вільна дискусія. Всі очні експертизи мають недоліки, пов'язані з можливостями негативного впливу на їх проведення соціально-психологічних властивостей і кланових (партійних) пристрастей учасників, а також нерівності їх професійного, посадового, наукового статусів. Уявіть собі, що зберуться разом 5 лейтенантів і 3 генерала. Незалежно від того, яка інформація є у того чи іншого учасника зустрічі, хід її передбачити неважко: генерали будуть говорити, а лейтенанти - мовчати.

КОМБІНАЦІЯ РІЗНИХ ВИДІВ ЕКСПЕРТИЗИ. Реальні експертизи часто представляють собою комбінації різних описаних вище типів експертиз. Як приклад розглянемо захист студентом дипломного проекту. Спочатку йде многотуровая очна експертиза, проведена науковим керівником і консультантами, в результаті студент готує проект до захисту. Потім два експерта працюють заочно - це автор відкликання сторонньої організації і завідувач кафедрою, що допускає роботу до захисту. Зверніть увагу на відмінність завдань цих експертів і обсягів виконуваної ними роботи - один пише детальний огляд, другий розписом на титульному аркуші проекту дозволяє його захист. Нарешті - очна експертиза без обмежень (для членів державної атестаційної комісії). Дипломний проект оцінюється колегіально, за більшістю голосів, при цьому один з експертів (науковий керівник) знає роботу детально, а інші - в основному лише по доповіді. Таким чином, маємо поєднання многотуровой і однотуровой, заочних та очних експертиз. Подібні поєднання характерні для багатьох реально проводяться експертиз.

4. СУЧАСНА ТЕОРІЯ ВИМІРЮВАНЬ І ЕКСПЕРТНІ ОЦІНКИ

 Для подальшого більш поглибленого розгляду проблем експертних оцінок знадобляться деякі поняття так званої репрезентативною теорії вимірювань, Яка є основою теорії експертних оцінок, перш за все тієї її частини, яка пов'язана з аналізом висновків експертів, виражених в якісному (а не в кількісному) вигляді.

Думки експертів часто виражені в порядкової шкалою (Докладніше про шкалах йдеться нижче), т. Е. Експерт може сказати (і обгрунтувати), що один показник якості продукції більш важливий, ніж інший, перший технологічний об'єкт більш небезпечний, ніж другий, і т. Д. Але він не в змозі сказати, у скільки разів або на скільки важливіший, відповідно, більш небезпечний. Експертів часто просять дати ранжування (впорядкування) об'єктів експертизи, т. Е. Розташувати їх у порядку зростання (або зменшення) інтенсивності, що цікавить організаторів експертизи характеристики. Ранг - це номер (об'єкта експертизи) в упорядкованому ряду. Формально ранги виражаються числами 1, 2, 3, ..., але з цими числами можна робити звичні арифметичні операції. Наприклад, хоча 1 + 2 = 3, але не можна стверджувати, що для об'єкта, що стоїть на третьому місці в упорядкуванні, інтенсивність досліджуваної характеристики дорівнює сумі інтенсивностей об'єктів з рангами 1 і 2. Так, один з видів експертного оцінювання - оцінки учнів. Навряд чи хто-небудь буде стверджувати, що знання відмінника дорівнюють сумі знань двієчника і трієчника (хоча 5 = 2 + 3), хорошист відповідає двом двієчникам (2 + 2 = 4), а між відмінником і трієчником така ж різниця, як між хорошистом і двієчником (5 - 3 = 4 - 2). Тому очевидно, що для аналізу подібного роду якісних даних необхідна не всім відома арифметика, а інша теорія, що дає базу для розробки, вивчення і застосування конкретних методів розрахунку. Це і є ГТВ. Треба мати на увазі, що в даний час термін "теорія вимірювань" застосовується для позначення цілого ряду наукових дисциплін: класичної метрології, РТВ, деяких інших напрямів, наприклад, алгоритмічної теорії вимірювань.

Спочатку ГТВ розвивалася як теорія психофізичних вимірювань. Основоположник ГТВ американський психолог С. с. Стівенс основну увагу приділяв шкалами вимірювання. Характерний наступний етап розвитку ГТВ. Один з томів випущеної в США в 1950-х роках "Енциклопедії психологічних наук" називався "Психологічні вимірювання". Значить, укладачі цього тому розширили сферу застосування ГТВ з психофізики на психологію в цілому. А в основній статті в цьому збірнику під назвою, зверніть увагу, "Основи теорії вимірювань", виклад йшло на абстрактно-математичному рівні, без прив'язки до будь-якої конкретної області застосування. У цій статті наголос був зроблений на "гомоморфізми емпіричних систем з відносинами в числові" (в ці математичні терміни тут вдаватися немає необхідності), і математична складність зросла в порівнянні з роботами С. с. Стівенса.

Уже в одній з перших вітчизняних статей з РТВ (кінець 1960-х років) було встановлено, що бали, що привласнюються експертами при оцінці об'єктів експертизи, як правило, виміряні в порядкової шкалою. Вітчизняні роботи, що з'явилися на початку 1970-х років, призвели до істотного розширення області використання ГТВ. Її застосовували до педагогічної кваліметрії (виміру якості знань учнів), в системних дослідженнях, в різних задачах теорії експертних оцінок, для агрегування показників якості продукції, в соціологічних дослідженнях, і ін.

В якості двох основних проблем ГТВ поряд з встановленням типу шкали був висунутий пошук алгоритмів аналізу даних, результат роботи яких не змінюється при будь-якому допустимому перетворення шкали (т. е. є інваріантним щодо цього перетворення).

Основні шкали вимірювання.Відповідно до ГТВ при математичному моделюванні реального явища або процесу слід перш за все встановити, В яких типах шкал виміряні ті чи інші змінні. Тип шкали задає групу допустимих перетворень. Допустимі перетворення не змінюють співвідношень між об'єктами вимірювання. Наприклад, при вимірюванні довжини перехід від аршин до метрам не змінює співвідношень між довжинами розглянутих об'єктів - якщо перший об'єкт довше другого, то це буде встановлено і при вимірюванні в аршинах, і при вимірюванні в метрах.

Зазначимо основні види шкал вимірювання і відповідні групи допустимих перетворень. В шкалою найменувань (Інша назва - номінальная шкали) допустимими є всі взаємно-однозначні перетворення. У цій шкалі числа використовуються лише як мітки. Приблизно так само, як при здачі білизни в пральню, т. Е. Лише для розрізнення об'єктів. У шкалі найменувань виміряні, наприклад, номери телефонів, автомашин, паспортів, студентських квитків. Пол людей теж виміряно в шкалі найменувань, результат вимірювання приймає два значення - чоловічий, жіночий. Раса, національність, колір очей, волосся - номінальні ознаки. Номери букв в алфавіті - теж вимірювання в шкалі найменувань. Нікому в здоровому глузді не прийде в голову складати або множити номера телефонів, такі операції не мають сенсу. Порівнювати букви і говорити, наприклад, що буква П краще літери С, також ніхто не буде. Єдине, для чого існують вимірювання в шкалі найменувань - це розрізняти об'єкти. У багатьох випадках тільки це від них і потрібно. Наприклад, шафки в роздягальнях для дорослих розрізняють за номерами, т. Е. Числам, а в дитячих садах використовують малюнки, оскільки діти ще не знають чисел.

В порядкової шкалою числа використовуються для встановлення порядку між об'єктами. Найпростішим прикладом є оцінки знань учнів. Символічно, що в середній школі застосовуються оцінки 2, 3, 4, 5, а у вищій рівно той же сенс виражається словесно - незадовільно, задовільно, добре, відмінно. Цим підкреслюється "нечислової" характер оцінок знань учнів. У порядкової шкалою допустимими є все строго зростаючі перетворення.

Встановлення типу шкали, т. Е. Завдання групи допустимих перетворень шкали вимірювання - справа фахівців відповідної прикладної області. Так, оцінки привабливості професій ми, виступаючи в якості соціологів, вважали вимірами у порядкової шкалою. Однак окремі соціологи не погоджувалися з нами, вважаючи, що випускники шкіл користуються шкалою з більш вузькою групою допустимих перетворень, наприклад, інтервального шкалою. Очевидно, ця проблема стосується не до математики, а до наук про людину. Для її вирішення може бути поставлений досить трудомісткий експеримент. Поки ж він не поставлено, доцільно приймати порядкову шкалу, так як це гарантує від можливих помилок.

Оцінки експертів, як уже зазначалося, часто слід вважати вимірами у порядкової шкалою. Типовим прикладом є задачі ранжування і класифікації промислових об'єктів, що підлягають екологічному страхуванню (див. Нижче).

Чому думки експертів природно виражати саме в порядкової шкалою? Як показали численні досліди, людина правильніше (і з меншими труднощами) відповідає на питання якісного, наприклад, порівняльного, характеру, ніж кількісного.Так, йому легше сказати, яка з двох гир важче, ніж вказати їх приблизний вага в грамах.

Використовується багато інших відомих прикладів порядкових шкал. Так, наприклад, в мінералогії використовується шкала Мооса, за яким мінерали класифікуються згідно з критерієм твердості. А саме: тальк має бал 1, гіпс - 2, кальцій - 3, флюорит - 4, апатит - 5, ортоклаз - 6, кварц - 7, топаз - 8, корунд - 9, алмаз - 10. порядкової шкали в географії є ??- бофортова шкала вітрів ( "штиль", "слабкий вітер", "помірний вітер" і т. д.), шкала сили землетрусів. У медицині порядковими шкалами є - шкала стадій гіпертонічної хвороби (по М'ясникову), шкала ступенів серцевої недостатності (за Стражеска-Василенко-Лангу), шкала ступеня вираженості коронарної недостатності (за Фогельсон). Номери будинків також виміряні в порядкової шкалою. При оцінці якості продукції і послуг, в т. Н. кваліметрії (буквальний переклад: вимір якості) популярні порядкові шкали. А саме, одиниця продукції оцінюється як придатна чи не годна. При більш ретельному аналізі використовується шкала з трьома градаціями: є значні дефекти - присутні тільки незначні дефекти - немає дефектів.

При оцінці впливу на навколишнє середовище перша оцінка - зазвичай порядкова: природне середовище стабільна - природне середовище пригнічена (деградує). Аналогічно в еколого-медичної шкалою: немає вираженого впливу на здоров'я людей - зазначається негативний вплив на здоров'я. Порядкова шкала використовується і в інших областях.

Порядкова шкала і шкала найменувань - основні шкали якісних ознак. Тому в багатьох конкретних областях результати якісного аналізу можна розглядати як вимірювання за цими шкалами.

Шкали кількісних ознак - це шкали інтервалів, відносин, різниць, абсолютна. за шкалою інтервалів вимірюють величину потенційної енергії або координату точки на прямій. У цих випадках на шкалі можна відзначити ні природне початок відліку, ні природну одиницю виміру. Допустимими перетвореннями в шкалі інтервалів є лінійні зростаючі перетворення, т. Е. Лінійні функції. Температурні шкали Цельсія і Фаренгейта пов'язані саме такою залежністю: С0 = 5/9 (Ф0 - 32), де С0 - Температура за шкалою Цельсія, а Ф0 - Температура за шкалою Фаренгейта.

З кількісних шкал найбільш поширеними в науці і практиці є шкали відносин. У них є природне початок відліку - нуль, т. Е. Відсутність величини, але немає природної одиниці виміру. За шкалою відносин виміряні більшість фізичних одиниць: маса тіла, довжина, заряд, а також ціни в економіці. Допустимими перетвореннями шкалою відносин є подібні (змінюють тільки масштаб). Іншими словами, лінійні зростаючі перетворення без вільного члена.

Час вимірюється за шкалою різниць, Якщо рік приймаємо природної одиницею виміру, і за шкалою інтервалів в загальному випадку. Природного початку відліку вказати на сучасному рівні знань можна. Дату створення світу різні автори розраховують по-різному, так само як і момент народження Христа. Так, згідно з новою статистичної хронології Господь Ісус Христос народився в 1054 р в Стамбулі (він же - Царгород, Візантія, Троя, Єрусалим, Рим) за прийнятим нині літочисленням.

Тільки для абсолютної шкали результати вимірювань - числа в звичайному сенсі слова. Прикладом є число людей в кімнаті. Для абсолютної шкали допустимим є тільки тотожне перетворення.

У процесі розвитку відповідної галузі знання тип шкали може змінюватися. Так, спочатку температура вимірювалася по порядкової шкалою (холодніше - тепліше). Потім - по інтервального (Шкали Цельсія, Фаренгейта, Реомюра). Нарешті, після відкриття абсолютного нуля температуру слід вважати виміряної за шкалою відносин (Шкала Кельвіна). Треба відзначити, що серед фахівців іноді є розбіжності з приводу того, за якими шкалами слід вважати вимірюються ті чи інші реальні величини. Іншими словами, процес вимірювання включає в себе і визначення типу шкали (разом з обґрунтуванням).

Інваріантні алгоритми та середні величини.Основна вимога до алгоритмів аналізу даних формулюється в РТИ так: висновки, зроблені на основі даних, виміряних в шкалі певного типу, не повинні мінятися при припустимому перетворення шкали вимірювання цих даних. Іншими словами, висновки повинні бути інваріантні по відношенню до допустимих перетворень шкали.

Таким чином, одна з основних цілей теорії вимірювань - боротьба з суб'єктивізмом дослідника при приписуванні чисельних значень реальним об'єктам. Так, відстані можна вимірювати в аршинах, метрах, мікронах, милях, парсеках та інших одиницях виміру. Масу (вага) - у пудах, кілограмах, фунтах і ін. Ціни на товари і послуги можна вказувати в юанях, рублях, тенге, гривнях, латах, кронах, марках, доларах США та інших валютах (за умови заданих курсів перерахунку). Підкреслимо дуже важливе, хоча і цілком очевидна обставина: вибір одиниць вимірювання залежить від дослідника, т. Е. Суб'єктивний. Статистичні висновки можуть бути адекватні реальності тільки тоді, коли вони не залежать від того, яку одиницю виміру віддасть перевагу дослідник, т. Е. Коли вони інваріантні щодо допустимої перетворення шкали.

Як приклад розглянемо обробку думок експертів, виміряних в порядкової шкалою. нехай Y1, Y2, ..., Yn - Сукупність оцінок експертів, "виставлених" одному об'єкту експертизи (наприклад, одному з варіантів стратегічного розвитку фірми), Z1, Z2, ..., Zn - Другого (іншим варіантом такого розвитку).

Як порівнювати ці сукупності? Очевидно, найпростіший спосіб - за середнім значенням. А як обчислювати середні? Відомі різні види середніх величин: середнє арифметичне, медіана, мода, середнє геометричне, середнє гармонійне, середнє квадратичне. Узагальненням кількох з перелічених є середнє за Колмогорова. для чисел X1, X2, ..., Xn середнє за Колмогорова обчислюється за формулою

G {(F (X1) + F (X2) + ... F (Xn)) / n},

де F - Строго монотонна функція, G - Функція, обернена до F. Серед середніх за Колмогорова - багато добре відомих персонажів. Так, якщо F (x) = x, То середнє за Колмогорова - це середнє арифметичне, якщо F (x) = ln x, То середнє геометричне, якщо F (x) = 1 / x, То середнє гармонійне, якщо F (x) = x2, То середньоквадратичне, і т. Д. З іншого боку, такі популярні середні, як медіана і мода, не можна уявити у вигляді середніх за Колмогорова.

Нагадаємо, що загальне поняття середньої величини введено французьким математиком першої половини ХІХ ст. академіком О. Коші. Воно таке: середньою величиною є будь-яка функція f (X1, X2, ... Xn) така, що при всіх можливих значеннях аргументів значення цієї функції не менше, ніж мінімальна з чисел X1, X2, ... Xn , І не більше, ніж максимальне з цих чисел. Середнє за Колмогорова - окремий випадок середнього по Коші. Медіана і мода, хоча і не є середніми за Колмогорова, але теж - середні по Коші.

При допустимому перетворення шкали значення середньої величини, очевидно, змінюється. Але висновки про те, для якої сукупності середнє більше, а для якої - менше, не повинні мінятися (відповідно до вимоги інваріантності висновків, прийнятому як основна вимога в ГТВ). Сформулюємо відповідну математичну задачу пошуку виду середніх величин, результат порівняння яких стійкий щодо допустимих перетворень шкали.

нехай f (X1, X2, ..., Xn) - Середнє по Коші. Нехай середнє по першій сукупності менше середнього по другій сукупності:

f (Y1, Y2, ..., Yn)

Згідно ГТВ для стійкості результату порівняння середніх необхідно, щоб для будь-якого допустимого перетворення g з групи допустимих перетворень у відповідній шкалі було справедливо також нерівність

f (g (Y1), g (Y2), ..., g (Yn))

т. е. середнє перетворених значень з перших сукупності також було менше середнього перетворених значень для другої сукупності. Причому сформульоване умова повинна бути вірно для будь-яких двох сукупностей Y1, Y2, ..., Yn и Z1, Z2, ..., Zn і, нагадаємо, будь-якого допустимого перетворення g. Згідно ГТВ тільки такими середніми можна користуватися при аналізі думок експертів і інших даних, виміряних в розглянутій шкалою.

За допомогою математичної теорії, розвинутої А. і. Орловим в 1970-х роках, вдається описати вид допустимих середніх в основних шкалах: в шкалі найменувань як середнього годиться тільки мода; з усіх середніх за Коші в порядкової шкалою як середніх можна використовувати тільки члени варіаційного ряду (порядкові статистики), зокрема, медіану (при непарному обсязі вибірки; при парному ж обсязі слід застосовувати один з двох центральних членів варіаційного ряду - як їх іноді називають , ліву медіану або праву медіану), але не середнє арифметичне, середнє геометричне і т. д .; в шкала інтервалів з усіх середніх за Колмогорова можна застосовувати тільки середнє арифметичне; в шкалі відносин з усіх середніх за Колмогорова стійкими щодо порівняння є тільки статечні середні і середнє геометричне.

Наведемо чисельний приклад, що показує некоректність використання середнього арифметичного f (X1, X2) = (X1 + X2) / 2 в порядкової шкалою. нехай Y1 = 1, Y2 = 11, Z1 = 6, Z2 = 8. тоді f (Y1, Y2) = 6, Що менше, ніж f (Z1, Z2) = 7. Нехай суворо зростаюче перетворення g таке, що g (1) = 1, g (6) = 6, g (8) = 8, g (11) = 99. Таких перетворень багато. Наприклад, можна покласти g (x) = x при x, Що не перевищують 8, і g (x) = 99 (x-8) / 3 + 8 для х, Великих 8. Тоді f (g (Y1), g (Y2)) = 50, Що більше, ніж f (g (Z1), g (Z2)) = 7. Як бачимо, в результаті допустимого, т. Е. Суворо зростаючого перетворення шкали впорядкованість середніх змінилася.

Наведені результати про середні величини широко застосовуються, причому не тільки в теорії експертних оцінок або соціології, а й, наприклад, для аналізу методів агрегування датчиків в АСУ ТП доменних печей. Велико прикладне значення ГТВ в задачах стандартизації та управління якістю, зокрема, в кваліметрії. Тут є і цікаві теоретичні результати. Так, наприклад, будь-яка зміна коефіцієнтів вагомості одиничних показників якості продукції призводить до зміни впорядкування виробів по середньозваженому показнику (ця теорема доведена В. в. Подиновский).

Методи середніх балів.В даний час поширені експертні, маркетингові, кваліметріческіе, соціологічні та інші опитування, в яких опитуваних просять виставити бали об'єктам, виробів, технологічних процесів, підприємствам, проектам, заявками на виконання науково-дослідних робіт, ідеям, проблем, програмами, політикам і т. п., а потім розраховують середні бали і розглядають їх як інтегральні оцінки, виставлені колективом опитаних. Якими формулами користуватися для обчислення середніх величин? Адже середніх величин, як ми знаємо, дуже багато різних видів. Зазвичай застосовують середнє арифметичне. Ми вже більше 25 років знаємо, що такий спосіб є коректним, Оскільки бали зазвичай виміряні в порядкової шкалою (див. Вище). Обгрунтованим є використання медіан як середніх балів. Однак повністю ігнорувати середні арифметичні недоцільно через їх звичності і поширеності. Тому доцільно використовувати одночасно обидва методи - і метод середніх арифметичних рангів (балів), і методів медіанний рангів. Така рекомендація знаходиться у згоді з концепцією стійкості, рекомендується використовувати різні методи для обробки одних і тих же даних з метою виділити висновки, одержувані одночасно при всіх методах. Такі висновки, мабуть, відповідають реальній дійсності, в той час як укладення, мінливі від методу до методу, залежать від суб'єктивізму дослідника, що вибирає метод обробки вихідних експертних оцінок.

Приклад порівняння восьми проектів.Розглянемо конкретний приклад застосування тільки що сформульованого підходу. За завданням керівництва фірми аналізувалися вісім проектів, пропонованих для включення в план стратегічного розвитку фірми. Вони були позначені таким чином: Д, Л, М-К, Б, Г-Б, Сол, Стеф, К (за прізвищами менеджерів, які запропонували їх для розгляду). Всі проекти були спрямовані 12 експертам, призначеним Правлінням фірми. У наведеній нижче табл.1 приведені ранги восьми проектів, присвоєні їм кожним з 12 експертів відповідно до подання експертів про доцільність включення проекту в стратегічний план фірми. При цьому експерт додає ранг 1 найкращого проекту, який обов'язково треба реалізувати. Ранг 2 отримує від експерта другий за привабливістю проект, ..., нарешті, ранг 8 - найбільш сумнівний проект, який реалізовуватимуть варто лише в останню чергу). Аналізуючи результати роботи експертів (т. Е. Табл.1), члени Правління фірми були змушені констатувати, що повної згоди між експертами немає, а тому дані, наведені в таблиці, слід піддати більш ретельному математичного аналізу.

Таблиця 1.

Ранги 8 проектів за ступенем привабливості

для включення в план стратегічного розвитку фірми.

 № експерта Д Л  М-К Б  Г-Б  сол  Стеф К
 2,5  2,5

Примітка. Експерт № 4 вважає, що проекти М-К і Б рівноцінні, але поступаються лише одному проекту - проекту Сол. Тому проекти М-К і Б повинні були б стояти на другому і третьому місцях і отримати бали 2 і 3. Оскільки вони рівноцінні, то отримують середній бал (2 + 3) / 2 = 5/2 = 2,5.

Метод середніх арифметичних рангів.Спочатку був застосований метод середніх арифметичних рангів. Для цього перш за все була підрахована сума рангів, привласнених проектам (див. Табл.1). Потім ця сума була розділена на число експертів, в результаті розрахований середній арифметичний ранг (саме ця операція дала назву методу). За середніми рангах будується підсумкова ранжування (в іншій термінології - впорядкування), виходячи з принципу - чим менше середній ранг, чим краще проект.

Найменший середній ранг, рівний 2,625, у проекту Б, - отже, в підсумковій ранжування він отримує ранг 1. Наступна за величиною сума, рівна 3,125, у проекту М-К, - і він отримує підсумковий ранг 2. Проекти Л і Сол мають однакові суми (рівні 3,25), отже, з точки зору експертів вони рівноцінні (при даному способі відомості разом думок експертів), а тому вони повинні б стояти на 3 та 4 місцях і отримують середній бал (3 + 4) / 2 = 3 , 5. Подальші результати наведені в табл.2 нижче. Отже, ранжування за сумами рангів (або, що те ж саме, за середнім арифметичним рангів) має вигляд:

Б <М-К <{Л, Сол} <Д <Стеф <Г-Б <К. (3)

Тут запис типу "А <Б" означає, що проект А передує проекту Б (т. Е. Проект А краще проекту Б). Оскільки проекти Л і Сол отримали однакову суму балів, то з даного методу вони еквівалентні, а тому об'єднані в групу (в фігурних дужках). У термінології математичної статистики ранжування (3) має одну зв'язок.

Таблиця 2.

Результати розрахунків за методом середніх арифметичних

і методу медіан для даних, наведених в табл. 2.5.1.

  Д Л  М-К Б  Г-Б  сол  Стеф К
 сума рангів  37,5  31.5
 Середнє арифметичне рангів  3,25  3,125  2,625  6,333  3,25  5,333  7,083
 Підсумковий ранг по середньому арифметичному  3,5  3,5
 медіани рангів  2,25  7,5
 Підсумковий ранг по медианам  2,5  2,5

Метод медіан рангів.Значить, підсумок розрахунків - ранжування (3), і на її основі має бути приймати рішення? Але тут найбільш знайомий із сучасною економетрикою член Правління згадав, що відповіді експертів виміряні в порядкової шкалою, а тому для них неправомірно проводити усереднення методом середніх арифметичних. Треба використовувати метод медіан. Що це означає? Треба взяти відповіді експертів, відповідні одному з проектів, наприклад, проекту Д. Це ранги 5, 5, 1, 6, 8, 5, 6, 5, 6, 5, 7, 1. Потім їх треба розташувати в порядку неспадання (простіше було б сказати - "в порядку зростання", але оскільки деякі відповіді збігаються, то доводиться використовувати незвичний термін "неубиванія"). Отримаємо послідовність: 1, 1, 5, 5, 5, 5, 5, 6, 6, 6, 7, 8. На центральних місцях - шостому і сьомому - стоять 5 і 5. Отже, медіана дорівнює 5.

Медіани сукупностей з 12 рангів, які відповідають певним проектам, наведені в передостанньому рядку табл.2. (При цьому медіани обчислені за звичайними правилами статистики - як середнє арифметичне центральних членів варіаційного ряду.) Підсумкове впорядкування по методу медіан приведено в останньому рядку таблиці. Топ сайтів (т. Е. Впорядкування - підсумкове думка комісії експертів) по медианам має вигляд:

Б <{М-К, Л} <Сол <Д <Стеф <К <Г-Б. (4)

Оскільки проекти Л і М-К мають однакові медіани балів, то з даного методу ранжування вони еквівалентні, а тому об'єднані в групу (кластер), т. Е. З точки зору математичної статистики ранжування (4) має одну зв'язок.

Порівняння ранжировок за методом середніх арифметичних і методу медіан.Порівняння ранжировок (3) і (4) показує їх близькість (схожість). Можна прийняти, що проекти М-К, Л, Сол впорядковані як М-К <Л <Сол, але через похибки експертних оцінок в одному методі визнані рівноцінними проекти Л і Сол (ранжування (3)), а в іншому - проекти М-К і Л (ранжування (4)). Істотним є лише розбіжність, що стосується впорядкування проектів До і Г-Б: в ранжировке (3) Г-Б <К, а в ранжировке (4), навпаки, К <Г-Б. Однак ці проекти - найменш привабливі з восьми розглянутих, і при виборі найбільш привабливих проектів для подальшого обговорення і використання ця розбіжність не суттєво.

Розглянутий приклад демонструє схожість і відмінність ранжировок, отриманих за методом середніх арифметичних рангів і по методу медіан, а також користь від їх спільного застосування.

 



ПІДБІР ЕКСПЕРТІВ | МЕТОД УЗГОДЖЕННЯ кластерізованний ранжировок
© um.co.ua - учбові матеріали та реферати