По данным представленным в табл., провести классификацию n = 4 предприятий по двум показателям
Номер предприятия 1 2 3 4
хi(1) 9 6 2 8
xi(2) 6 10 4 9
Классификацию провести по иерархическому агломеративному алгоритму с использованием обычного евклидова расстояния, а расстояние между кластерами определять по принципу «ближайшего» соседа и центра тяжести.

Принцип “ближайшего соседа”.
Исходные данные.

№ п/п 1 2 3 4
x1 9 6 2 8
x2 6 10 4 9
1. Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами примем обычное евклидовое расстояние. Тогда согласно формуле:
EQ p(xixj) = r(∑(xil-xji)2)
где l — признаки; k — количество признаков
EQ p(12) = r((9-6)2 + (6-10)2) = 5
EQ p(13) = r((9-2)2 + (6-4)2) = 7.28
EQ p(14) = r((9-8)2 + (6-9)2) = 3.16
2. Полученные данные помещаем в таблицу (матрицу расстояний).

№ п/п 1 2 3 4
1 0 5 7.28 3.16
2 5 0 7.21 2.24
3 7.28 7.21 0 7.81
4 3.16 2.24 7.81 0
3. Поиск наименьшего расстояния.
Из матрицы расстояний следует, что объекты 2 и 4 наиболее близки P2;4 = 2.24 и поэтому объединяются в один кластер.

№ п/п 1 [2] 3 [4]
1 0 5 7.28 3.16
[2] 5 0 7.21 2.24
3 7.28 7.21 0 7.81
[4] 3.16 2.24 7.81 0
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №2 и №4.
В результате имеем 3 кластера: S(1), S(2,4), S(3)
Из матрицы расстояний следует, что объекты 1 и 2,4 наиболее близки P1;2,4 = 3.16 и поэтому объединяются в один кластер.

№ п/п [1] [2,4] 3
[1] 0 3.16 7.28
[2,4] 3.16 0 7.21
3 7.28 7.21 0
При формировании новой матрицы расстояний, выбираем наименьшее значение из значений объектов №1 и №2,4.
В результате имеем 2 кластера: S(1,2,4), S(3)

№ п/п 1,2,4 3
1,2,4 0 7.21
3 7.21 0
Таким образом, при проведении кластерного анализа по принципу “ближнего соседа” получили два кластера, расстояние между которыми равно P=7.21

Принцип центра тяжести

1-3 тот же
Из матрицы расстояний следует, что объекты 2 и 4 наиболее близки P2;4 = 2.24 и поэтому объединяются в один кластер.

№ п/п 1 [2] 3 [4]
1 0 5 7.28 3.16
[2] 5 0 7.21 2.24
3 7.28 7.21 0 7.81
[4] 3.16 2.24 7.81 0
При формировании новой матрицы расстояний, найдем центр тяжести объектов №2 и №4, как среднее арифметическое координат.

[2+4]=[(6+8)/2;(10+9)/2]=(7;9.5)
Далее пересчитаем расстояние от этого центра до объектов №2,№4

В результате имеем 3 кластера: S(2,4), S(1), S(3)
Из матрицы расстояний следует, что объекты 2+4 и 1 наиболее близки P2+4;1 = 4.03 и поэтому объединяются в один кластер.

№ п/п [1] [2,4] 3
[1] 0 4.03 7.28
[2,4] 4.03 0 7.43
3 7.28 7.43 0

При формировании новой матрицы расстояний, вычислим центр тяжести объектов №2+4 и №1.
[2+4.1]=[(7+9)/2;(9,5+6)/2]=(8;7.75)
Расстояние равно

В результате имеем 2 кластера: S(1,3), S(2,4)

№ п/п
3 2,4,1
3 0 7,08
2,4,1 7.08 0
Таким образом, при проведении кластерного анализа по принципу “центра тяжести” получили два кластера, расстояние между которыми равно P=7.08

8. Приложение

Таблица 1
СТРАНЫ МИРА В 1995 ГОДУ

z x1 x2 x3 x4 x5 x6 x7 x8 x9
Афганистан 3 168 44 18 29 2,8 0,205 53 22 6,9
Аргентина 6 25,6 75 86 95 1,3 3,408 20 9 2,8
Армения 5 27 75 68 98 1,4 5,0 23 6 3,19
Австралия 1 7,3 80 85 100 1,38 16,848 15 8 1,9
Австрия 1 6,7 79 58 99 0,2 18,396 12 11 1,5
Азербайджан 5 35 75 54 98 1,4 3,0 23 7 2,8
Бахрейн 5 25 74 83 77 2,4 7,875 29 4 3,96
Бангладеш 3 106 53 16 35 2,4 0,202 35 11 4,7
Барбадос 6 20,3 78 45 99 0,21 6,95 16 8 1,78
Беларусь 2 19 76 65 99 0,32 6,5 13 11 1,88
Бельгия 1 7,2 79 96 99 0,2 17,912 12 11 1,7
Боливия 6 75 64 51 78 2,7 0,73 34 9 4,21
Босния 2 12,7 78 36 86 0,7 3,098 14 6 1,7
Ботсвана 4 39,3 66 25 72 2,7 2,677 32 8 5,1
Бразилия 6 66 67 75 81 1,28 2,354 21 9 2,7
Болгария 2 12 75 68 93 -0,2 3,831 13 12 1,8
Буркина-Фасо 4 118 50 15 18 2,81 0,357 47 18 6,94
Бурунди 4 105 50 5 50 2,26 0,208 44 21 6,8
Камбоджа 3 112 52 12 35 2,9 0,26 45 16 5,81
Камерун 4 77 58 40 54 2,9 0,993 41 12 5,7
Канада 1 6,8 81 77 97 0,7 19,904 14 8 1,8
Цент.Афр.Рес. 4 137 44 47 27 2,4 0,457 44 21 5,42
Чили 6 14,6 78 85 93 1,7 2,591 23 6 2,5
Китай 3 52 69 26 78 1,1 0,377 21 7 1,84
Колумбия 6 28 75 70 87 2 1,538 24 6 2,47
Коста-Рика 6 11 79 47 93 2,3 2,031 26 4 3,1
Хорватия 2 8,7 77 51 97 -0,1 5,487 11 11 1,65
Куба 6 10,2 78 74 94 0,95 1,382 17 7 1,9
Чехия 2 9,3 77 69 99 0,21 7,311 13 11 1,84
Дания 1 6,6 79 85 99 0,1 18,277 12 12 1,7
Доминик.Респ
6 51,5 70 60 83 1,8 1,034 25 6 2,8
Эквадор 6 39 73 56 88 2,01 1,085 26 6 3,08
Египет 5 76,4 63 44 48 1,95 0,748 29 9 3,77
Сальвадор 6 41 69 44 73 2,04 1,078 33 7 3,78
Эстония 2 19 76 72 99 0,52 6,0 14 12 2
Эфиопия 4 110 54 12 24 3,1 0,122 45 14 6,81
Финляндия 1 5,3 80 60 100 0,3 15,877 13 10 1,8
Франция 1 6,7 82 73 99 0,47 18,944 13 9 1,8
Габон 4 94 58 46 61 1,46 4,283 28 14 3,97
Гамбия 4 124 52 23 27 3,1 0,351 46 16 6,29
Грузия 2 23 76 56 99 0,8 4,5 16 9 2,18
Германия 1 6,5 79 85 99 0,36 17,539 11 11 1,47
Греция 1 8,2 80 63 93 0,84 8,06 10 10 1,5
Гватемала 6 57 67 39 55 2,58 1,342 35 8 4,76
Гаити 6 109 47 29 53 1,63 0,383 40 19 5,94
Гондурас 6 45 70 44 73 2,73 1,03 35 6 4,9
Гонконг 3 5,8 80 94 77 -0,09 14,641 13 6 1,4
Венгрия 2 12,5 76 64 99 -0,3 5,249 12 13 1,8
Исландия 1 4 81 91 100 1,1 17,241 16 7 2,11
Индия 3 79 59 26 52 1,9 0,275 29 10 4,48
Индонезия 3 68 65 29 77 1,6 0,681 24 9 2,8
Иран 5 60 67 57 54 3,46 1,5 42 8 6,33
Ирак 5 67 68 72 60 3,7 1,955 44 7 6,71
Ирландия 1 7,4 78 57 98 0,3 12,17 14 9 1,99
Израиль 5 8,6 80 92 92 2,22 13,066 21 7 2,83
Италия 1 7,6 81 69 97 0,21 17,5 11 10 1,3
Япония 3 4,4 82 77 99 0,3 19,86 11 7 1,55
Иордания 5 34 74 68 80 3,3 1,157 39 5 5,64
Кения 4 74 55 24 69 3,07 0,323 42 11 5,91
Кувейт 5 12,5 78 96 73 5,24 6,818 28 2 4
Латвия 2 21,5 75 71 99 0,5 7,4 14 12 2
Ливан 5 39,5 71 84 80 2 1,429 27 7 3,39
Либерия 4 113 57 45 40 3,3 0,409 43 12 6,8
Ливия 5 63 65 82 64 3,7 5,91 45 8 6,4
Литва 2 17 77 69 99 0,3 6,71 15 10 2
Малайзия 3 25,6 72 43 78 2,3 2,995 29 5 3,51
Мексика 6 35 77 73 87 1,9 3,604 28 5 3,2
Марокко 4 50 70 46 50 2,12 1,062 29 6 3,83
Сев.Корея
3 27,7 73 60 99 1,83 1,0 24 6 2,4
Нидерланды 1 6,3 81 89 99 0,58 17,245 13 9 1,58
Новая Зел. 1 8,9 80 84 99 0,57 14,381 16 8 2,03
Никарагуа 6 52,5 67 60 57 2,68 0,447 35 7 4,33
Нигерия 4 75 57 35 51 3,1 0,282 44 12 6,4
Норвегия 1 6,3 81 75 99 0,4 17,755 13 10 2
Оман 5 36,7 70 11 65 3,46 7,467 40 5 6,53
Пакистан 3 101 58 32 35 2,8 0,406 42 10 6,43
Панама 6 16,5 78 53 88 1,94 2,397 25 5 2,9
Парагвай 6 25,2 75 48 90 2,7 1,5 33 5 4,3
Перу 6 54 67 70 85 2 1,107 26 7 3,11
Филиппины 3 51 68 43 90 1,92 0,867 27 7 3,35
Польша 2 13,8 77 62 99 0,3 4,429 14 10 1,94
Португалия 1 9,2 78 34 85 0,36 9,0 12 10 1,5
Румыния 2 20,3 75 54 96 0,06 2,702 14 10 1,82
Россия 2 27 74 74 99 0,2 6,68 13 11 1,83
Руанда 4 117 46 6 50 2,8 0,292 49 21 8,19
Южная Корея 3 21,7 74 72 96 1 6,627 16 6 1,65
Сауд.Арав. 5 52 70 77 62 3,2 6,651 38 6 6,67
Сенегал 4 76 58 40 38 3,1 0,744 43 12 6,1
Сингапур 3 5,7 79 100 88 1,2 14,99 16 6 1,88
Сомали 4 126 55 24 24 3,2 2,126 46 13 7,25
ЮАР 4 47,1 68 49 76 2,6 3,128 34 8 4,37
Испания 1 6,9 81 78 95 0,25 13,047 11 9 1,4
Швеция 1 5,7 81 84 99 0,52 16,9 14 11 2,1
Швейцария 1 6,2 82 62 99 0,7 22,384 12 9 1,6
Сирия 5 43 68 50 64 3,7 2,436 44 6 6,65
Тайвань 3 5,1 78 71 91 0,92 7,055 15,6 6 1,7
Танзания 4 110 45 21 46 2,5 0,263 46 19 6,2
Таиланд 3 37 72 22 93 1,4 1,8 19 6 2,1
Турция 5 49 73 61 81 2,02 3,721 26 6 3,21
ОАЭ 5 22 74 81 68 4,8 14,193 28 3 4,5
Великобрит. 1 7,2 80 89 99 0,2 15,974 13 11 1,83
США 1 8,11 79 75 97 0,99 23,474 15 9 2,06
Уганда 4 112 43 11 48 2,42 0,325 49 24 6,77
Украина 2 20,7 75 67 97 0,05 2,34 12 13 1,82
Уругвай 6 17 77 89 96 0,8 3,131 17 10 2,44
Узбекистан 5 53 72 41 97 2,13 1,35 30 7 3,73
Венесуэла 6 28 76 91 88 2,16 2,829 26 5 3,05
Вьетнам 3 46 68 20 88 1,78 0,23 27 8 3,33
Замбия 4 85 45 42 73 2,8 0,573 46 18 6,68
z — регион или экономическая группа:
1 — группа развитых стран
2 — Восточная Европа
3 — Азиатско-Тихоокеанский регион
4 — Африка
5 — Ближний Восток
6 — Латинская Америка
x1 — детская смертность (количество умерших младенцев на 1000 новорожденных)
x2 – средняя продолжительность жизни женщин;
x3 — доля городского населения, %;
x4 — уровень грамотности населения, %;
x5 — прирост населения, %;
x6- ВВП на душу населения, тыс.долл.США;
x7 — уровень рождаемости (число родившихся на 1000 жителей);
x8 — уровень смертности (число умерших на 1000 жителей);
x9 -среднее число детей в семье.
семье.

По данным представленным в табл провести классификацию n = 4 предприятий по двум показателям Номер предприятия 1 2 3 4 хi(1) 9 6 2 8 xi(2) 6 10 4 9