Головна |
Суть ієрархічної кластеризації полягає в послідовному об'єднанні менших кластерів в великі або поділі великих кластерів на менші.
Ієрархічні агломеративні методи (Agglomerative Nesting, AGNES)
Ця група методів характеризується послідовним об'єднанням вихідних елементів і відповідним зменшенням числа кластерів.
На початку роботи алгоритму всі об'єкти є окремими кластерами. На першому кроці найбільш схожі об'єкти об'єднуються в кластер. На наступних кроках об'єднання триває до тих пір, поки всі об'єкти не будуть складати один кластер.
Ієрархічні дівізімние (подільні) методи (Divisive ANAIysis, DIANA)
Ці методи є логічною протилежністю агломеративного методам. На початку роботи алгоритму всі об'єкти належать одному кластеру, який на наступних кроках ділиться на менші кластери, в результаті утворюється послідовність розщеплюють груп.
Принцип роботи описаних вище груп методів у вигляді дендрограмми показаний на ріс.13.3.
Крок 0 Крок 1 Крок 2 Крок 3 Крок 4
агломеративні
методи
Дівізімние
методи
Крок 4 Крок 3 Крок 2 Крок 1 Крок 0
Мал. 13.3. Дендрограмма агломеративного і дівізімних методів
Програмна реалізація алгоритмів кластерного аналізу широко представлена ??в різних інструментах Data Mining, які дозволяють вирішувати завдання досить великої розмірності. Наприклад, агломеративні методи реалізовані в пакеті SPSS, дівізімние методи - в пакеті Statgraf.
Ієрархічні методи кластеризації розрізняються правилами побудови кластерів. Як правил виступають критерії, які використовуються при вирішенні питання про "Схожості" об'єктів при їх об'єднанні в групу (агломеративні методи) або поділу на групи (дівізімние методи).
Ієрархічні методи кластерного аналізу використовуються при невеликих обсягах наборів даних.
Перевагою ієрархічних методів кластеризації є їх наочність.
Ієрархічні алгоритми пов'язані з побудовою дендограмм (від грецького dendron - "Дерево"), Які є результатом ієрархічного кластерного аналізу. Дендрограмма описує близькість окремих точок і кластерів один до одного, представляє в графічному вигляді послідовність об'єднання (поділу) кластерів.
Метод екстремальної угруповання параметрів | Критерії раціонального вибору числа факторів | загальні висновки | Перевірка якісних характеристик вибірки | критерій Смирнова | Критерій однорідності Лемана-Розенблатта | Метод мінімальної відстані | Перевірка кількісних характеристик вибірки | Сутність, типологизация і прикладна спрямованість завдань класифікації об'єктів | Кластерний аналіз в задачах соціально-економічного прогнозування |