Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Висновок результатів та їх аналіз. Інформаційна частина діалогового вікна Joining Results Discriminant Function Analisis Results (результати



Інформаційна частина діалогового вікна Joining Results Discriminant Function Analisis Results (результати аналізу кластерних функцій) повідомляє, що

• Number of variables - число змінних;

• Number of cases - число спостережень;

• Missing data were casewise deleted - здійснена класифікація спостережень або змінних (залежить від рівня параметра в рядку Cluster в попередньому вікні налаштування.)

• Amalgation (joing) rule - правило об'єднання кластерів (назва ієрархічного агломеративного методу, заданого в рядку Amalgation rules, а в попередньому вікні налаштування);

• Distanse.metric is - Метрика відстані (залежить від установки в рядку Distance measure у попередньому вікні налаштування.

Користувач може викликати на екран горизонтальну і вертикальну діаграму (Horizontal hierachical plot або Vertical icicle plot). Найбільш традиційне - вертикальне уявлення. (Рис. 12).

Рис.12Vertical icicle plot

Тепер уявіть собі, що поступово (дуже малими кроками) ви "послабляєте" ваш критерій про те, які об'єкти є унікальними, а які ні. Іншими словами, ви знижуєте поріг, що відноситься до вирішення питання про об'єднання двох або більше об'єктів в один кластер. В результаті, ви пов'язуєте разом все більше і більше число об'єктів і об'єднуєте все більше і більше кластерів, що складаються з елементів, що усе більше відрізняються. Остаточно, на останньому кроці всі об'єкти об'єднуються разом. В результаті успішного аналізу методом об'єднання з'являється можливість виявити кластери (гілки) і інтерпретувати їх.

Щоб повернутися в вікно, що містить інші результати кластерного аналізу, необхідно натиснути на кнопку Continue.

Клацанням миші можна розкрити рядок Amalgamation schedule, що містить протокол об'єднання кластерів. Рис. 13

Рис. 13 Amalgamation schedule.

У заголовку вказано ієрархічний агломеративний метод і метрика відстані. Таблиця може займати кілька вікон.

Наступною у вікні результатів йде кнопка Graph of amalgamation schedule. Після натискання, розкривається вікно, що містить ступінчасте, графічне зображення змін відстаней при об'єднанні кластерів рис. 14.

Рис. 14 Graph of amalgamation schedule

Повернувшись в основне вікно результатів і класифікації. Для перегляду же матриці відстаней необхідно здійснити натискання по рядку Distance matrix (рис.15).

Рис.15 Матриця відстаней.

В основному вікні результатів класифікації є рядок Save distance matrix as: (Зберегти матрицю відстаней як ), що дозволяє задати ім'я файлу, в якому буде збережена матриця відстаней, яка в подальшому буде піддана обробці.

Рядок Discriptive statistics містить такі найважливіші описові статистики, як середнє (means) і середньоквадратичне відхилення (standart deviations) для кожного спостереження. При проведенні класифікації n об'єктів за k ознаками, для користувача виникає великий інтерес до значення цих показників для кожної ознаки. Для того щоб ці характеристики розраховувалися саме за ознаками необхідно повернуться в основне вікно налаштування параметрів і задати в рядку Cluster значення "variables (columns)".

 

ВАРІАНТИ ЗАВДАНЬ

Завдання полягає в тому, щоб перевірити коректність шуканої конфігурації об'єктів методом Joining (tree clustering) (ієрархічні агломеративні методи або деревоподібна кластеризація), проаналізуйте Vertical icicle plot, Amalgamation schedule, Graph of amalgamation schedule,матрицю відстаней.Використайте різні правила об'єднання кластерів (Amalgation (joing) rule) та метрику відстані (Distanse metric).

Завдання 1

У таблиці містяться дані про споживання продуктів на душу населення і показники - аргументи, які беруть участь у кластеризації.

Країни: X1 X2 X3 X4 X5 X6
Росія 3,9
Австралія 2,6 8,2
Австрія 5,3
Азербайдж. 4,1 12,4 7,9
Вірменія 3,7 4,3 6,5
Білорусь 3,6 5,4
Бельгія 6,9
Болгарія 9,5
Великобританія 3,5 8,8

Завдання 2

У таблиці містяться дані про економічні показники країн.

Країни: X5 X11 X6 X7 X10
Угорщина 32,1 64,73 24,5 39,8
Німеччина 38,1 36,63 76,2 8,6 56,9
Греція 41,5 32,84 44,4 5,7 37,4
Грузія 62,64 11,3 3,5 18,6
Данія 36,7 34,07 79,2 6,7 54,4
Ірландія 15,8 39,27 6,7 64,2
Іспанія 40,9 28,46 54,8 7,3 22,6
Італія 49,4 30,27 72,1 8,5
Казахстан 38,1 69,04 13,4 3,3 7,9
Канада 27,6 25,42 79,9 10,2 25,4
Киргизія 33,2 53,13 11,2 3,4

Завдання 3

У таблиці містяться дані про хімічні речовини(стовпці) та їхні складові сполуки(рядки).

Сполуки: SiO2 TiO2 Al2O3 FeO MgO CaO
a1 43.5 0.58 12.5 11.2 12.7 9.9
a2 53.6 1.2 13.2 10.5 12.4 8.5
a3 48.9 1.5 15.4 13.4 13.1 9.1
b1 41.7 2.1 16.2 10.5 8.6
b5 50.1 0.9 11.5 10.6 12.1 7.9
c6 40.2 1.5 14.2 10.4 11.9 8.1
d5 46.5 2.1 11.6 11.8 11.8 9.5
a7 51.6 1.8 10.3 12.5 12.4 8.9

Завдання 4

У таблиці містяться дані про рівень життя в українських містах.

Міста: X1 X2 X3 X4 X5 X6 X7
Львів
Луцьк
Донецьк
Київ
Житомир
Сімферополь
Кривий Ріг

Завдання 5

У таблиці містяться дані про міста Франції.

Міста: X1 X2 X3 X4 X5 X6 X7
Париж 9,5 15,6 123,1 11,2 32,9 565,4 7,4
Марсель 8,9 9,5 122,1 25,5 23,2 456,6 6,9
Ліон 7,1 9,9 112,6 14,9 11,6 543,2 6,4
Лілль 6,6 9,1 100,9 12,5 22,1 445,5 5,9
Ніцца 7,6 8,6 109,1 14,5 25,2 347,9 6,9
Тулуза 6,9 10,5 121,6 21,5 18,9 483,6 5,4
Бордо 5,1 11,9 119,1 17,1 25,5 451,2 5,9
Нант 4,5 5,6 100,6 15,9 16,2 489,5 1,4
Тулон 2,5 7,5 99,1 18,5 15,5 410,9 2,9

Завдання 6

У таблиці містяться дані про університети Європи.

Університет Х-ка X1 X2 X3 X4 X5 X6
Гарвардський університет
Кембриджський університет
Оксфордський університет
Массачусетський технологічний інститут
Йельський університет
Стенфордський університет
Каліфорнійський технологічний інститут
Каліфорнійський унiверситет
Імперський коледж Лондона
Принстонський університет

Завдання 7

У таблиці містяться дані про студентів.

Студент: X1 X2 X3 X4 X5 X6 X7 X8
Іванов
Петров
Штельмах
Сидоров
Федоров
Максимов
Вовков

Завдання 8

У таблиці містяться дані про футбольні клуби.

Клуб: X1 X2 X3 X4 X5 X6 X7 X8 X9
Челсі 11,3 12,8 22,6 22,4 56,2 56,1 55,1 147,3 444,2
Реал 12,8 14,2 25,32 22,3 25,21 25,31 54,11 454,2 541,2
Барселона 11,4 10,3 22,21 22,6 11,2 63,2 25,2 555,2 200,3
Манчестер Сіті 0,3 11,8 23,1 12,8 32,2 420,3
Манчестер Юнайтед 2,8 13,8 23,2 25,3 12,9 320,2 120,2
ПСЖ 11,5 11,1 41,2 22,5 62,6 42,6 41,2 329,2 256,2
Мілан 9,7 14,3 11,8 12,2 55,6 56,3 245,2
Інтер 2,8 13,7 23,1 22,2 22,6 68,82 200,5 145,4

Завдання 9

У таблиці містяться дані про грунти.

Х-ка Проба ґрунту X1 X2 X3 X4 X5 X5 X6
15.21 70.6 467.1 0.12 0.63 4.53
33.27 67.5 1059.8 0.15 1.19 4.9
68.09 1700.3 3309.7 0.36 2.3 4.82
32.89 168.1 1392.9 0.17 1.29 4.84
19.87 102.7 71.3 0.14 0.73 7.93
16.46 32.5 0.06 0.52 3.78
10.56 192.9 352.4 0.1 0.33 4.59
15.63 118.4 300.2 0.11 0.61 4.16
11.15 101.4 308.4 0.11 0.47 5.13
16.25 232.5 306.2 0.12 0.66 4.43
9.94 51.4 212.3 0.1 0.37 4.7
70.63 150.3 627.7 0.15 1.81 3.65
9.8 129.7 0.01 0.21 3.63
19.71 297.7 467.9 0.08 0.63 4.04
26.02 83.9 618.5 0.08 0.88 3.93
11.84 168.9 375.8 0.07 0.45 5.89
10.71 127.3 330.3 0.13 0.43 4.56
8.3 107.4 241.4 0.08 0.31 4.74
12.67 188.7 516.4 0.05 0.33 4.4
15.92 203.6 336.9 0.08 0.52 4.13
12.92 170.6 319.6 0.06 0.44 4.05
7.54 53.8 315.7 0.05 0.28 4.7
21.96 104.3 578.8 0.12 0.81 4.11
88.78 107.6 1156.8 0.06 0.99 3.19
72.19 174.7 1061.3 0.14 2.32 3.93

Завдання 10

У таблиці містяться дані про річки світу.

Річка: X1 X2 X3 X3 X4 X5 X6
Амазонка 5421,3 22,43 65,32 21,4 123,32 32,42 123,4
Волга 1233l,2 32,54 32,34 32,34 845,98 61,24 343,6
Урал 5343,21 12,76 12,63 34,4 456,96 29,63 341,8
Дон 2134,1 65,62 34,74 54,4 345,56 54,75 132,7
Хуанхе 6542,2 43,43 54,85 76,3 356,73 37,45 143,9
Об 2434,6 32,34 76,54 43,3 357,74 36,52 162,05
Конго 2342,5 12,23 23,63 65,23 343,52 47,22 179,66
Міссісіпі 4123,8 54,21 45,34 76,3 324,57 32,34 146,54
Одер 2342,43 32,76 45,44 43,3 111,74 35,55 137,44

Завдання 11

У таблиці містяться дані про економічні центри Італії.

Місто: X1 X2 X3 X4 X5 X6 X7 X8
Рим 12,43 32,76 45,43 76,34 98,55 34,44 48,4 33,44
Турин 34,41 41,65 31,33 43,4 84,45 34,23 22,5 34,54
Мілан 41,22 32,54 83,5 23,5 56,34 45,23 84,76 43,54
Палермо 21,12 21,23 24,8 12,4 55,78 11,12 33,76 22,75
Болонья 31,32 11,33 26,32 38,77 43,43 21,65 45,882 11,98
Неаполь 12,45 12,44 29,56 73,54 82,23 12,4 66,33 23,90

Завдання 12

У таблиці містяться дані про міста Іспанії.

Місто: X1 X2 X3 X4 X5 X6 X7 X8
Мадрид 234,44 654,6 888,44 455,98 455,1 452,4 121,6 3,88
Барселона 235,34 236,21 568,32 632,76 256,2 254,33 635,55 5,44
Більбао 236,23 256,32 756,54 256,67 356,5 563,11 256,5 8,3
Севілья 123,55 456,31 745,12 241,56 245,4 258,87 254,8 7,4
Валенсія 412,33 356,33 762,81 256,45 569,6 255,44 215,4 4,6
Сарагоса 125,12 359,44 741,5 256,54 589,8 452,43 248,3 7,7
Малага 149,45 354,44 621,65 254,44 514,9 145,5 524,30 7,3

Завдання 13

У таблиці містяться дані міста Англії.

Місто: X1 X2 X3 X4 X5 X6 X7 X8
Лондон 21,2 231,55 12,33 23,5 34,55 12,4 3,6 431,54
Манчестер 43,34 432,4 12,23 12,3 14,45 23,6 4,5 129,34
Портсмут 81,3 324,2 32,12 23,2 32,43 21,6 5,3 234,23
Ньюкасл 75,21 546,5 45,11 32,45 23,33 32,4 3,5 453,56
Ліверпуль 62,3 453,3 34,23 76,7 12,87 23,6 2,54 324,87
Бірмінгем 53,5 323,4 65,6 45,5 12,44 12,4 5,22 233,54
Бристоль 23,4 324,22 78,87 23,77 3,32 33,2 8,34 435,45

Завдання 14

У таблиці містяться дані про текстові документи.

Документ: X1 X2 X3 X4 X5 X6 X7 X8
Соціологія
Філософія
Макроекономіка
Історія економічних вчень
Етика
Мікроекономіка

Завдання 15

У таблиці містяться дані про інтернет ресурси.

Інтернет ресурс: X1 X2 X3 X4 X5 X6 X7 X8
http://www.champion.com.ua/ 2,3 2,2 3,5 2,5 3,3 2,6 4,8 4,4
http://24tv.ua/ 6,4 5,3 6,4 5,4 5,4 5,5 6,7 5,2
http://www.pravda.com.ua/ 6,5 6,6 5,4 7,7 7,7 6,4 5,6 7,3
http://zik.ua/ 6,5 5,5 7,3 6,5 5,6 7,4 7,5 7,2
http://techno.bigmir.net/ 1,8 2,4 1,6 1,4 2,5 2,3 2,4 3,8
http://www.pslan.com/ 5,4 8,8 6,8 6,4 7,8 7,2 8,3 6,1
http://www.lostfilm.tv/ 5,8 8,6 7,3 6,9 6,3 8,2 8,9 6,07

 

Вимоги до звіту

Оформити звіт для захисту лабораторної роботи за зразком:

· назва роботи

· мета роботи

· порядок роботи

· короткі теоретичні відомості

· аналіз отриманих результатів та висновок.


 

Оформлення звіту

Звіт повинен відповідати вище наведеним вимогам – Вимоги до звіту. Звіт оформляється на листах формату А4 (також додається електронний варіант). Титульна сторінка повинна містити: назву предмету, такий заголовок:

Звіт

до лабораторної роботи № 4

Кластеризація в Data Mining. Базові алгоритми кластеризації.

Ієрархічний алгоритм кластеризації

 

 

ПІБ, номер групи студента і дату виконання лабораторної роботи. Звіт подається викладачу для перевірки на занятті, які є наступними за даною лабораторною роботою.

 

Список рекомендованої літератури:

1. Маннинг К.Д., Рагхаван П., Шютце Х. - Введение в информационный поиск – 2011.

2. Баргасян А. А. Технології аналізу даних. Data Mining, Visual Mining, Text Mining, OLAP – 2007.

 

Контрольні питання:

1. Що таке кластеризація?

2. Що таке характеристична функція?

3. Як задається характеристична функція?

4. Опишіть формальне завдання кластеризації.

5. Що таке міра близькості? Як вона обчислюється?

6. Класифікація алгоритмів кластеризації.

7. У чому полягає різниця між агломеративними та подільними алгоритмами?

8. У чому полягає різниця між методами одиночного та повного зв'язку?

9. Часова складність алгоритмів кластеризації.

10. Де застосовується кластеризація?


Навчальне видання

Інтелектуальний аналіз даних

 

Методичні вказівки до лабораторної роботи № 4 Кластеризація в Data Mining. Базові алгоритми кластеризації. Ієрархічний алгоритм кластеризаціїз дисципліни Інтелектуальний аналіз даних для студентів спеціальності 0804 “Комп’ютерні науки”

 

Укладач:

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.