д
2. Розглянемо випадок, коли існує три класи (безлічі) об'єктів. Для цього до двох класам з попереднього прикладу додамо ще один. У цьому випадку будемо мати вже три матриці вихідних даних:
(25)
Якщо в процесі дискримінації використовуються всі чотири змінні (, , , ) то для кожного класу дискримінантні функції мають вигляд:
(26)
Визначимо тепер, до якого класу можна віднести кожне з чотирьох спостережень, наведених в табл.2:
Таблиця 2 - Вихідні дані
Номер
спостереження
1
1,07
93,5
5,30
5385
2
0,99
84,0
4,85
5225
3
0,70
76,8
3,50
5190
4
1,24
88,0
4,95
6280
Підставимо відповідні значення змінних,,, в вираз (26) і обчислимо потім різниці:
- = -20792,082 +31856,41 = 11064,3280,
- = -20792,082 +40016,428 = 19224,3460.
Отже, спостереження 1 в табл.2 відноситься до першого класу. Аналогічні розрахунки показують, що і інші три спостереження слід віднести теж до першого класу.
Щоб показати вплив числа дискримінантних змінних на результати класифікації, змінимо умову останнього прикладу. Будемо використовувати для розрахунку дискримінантних функцій тільки три змінні:,,. У цьому випадку вирази для діскрімінантниx функцій будуть мати вигляд:
<p> (27)
Підставивши в ці вираження значення вихідних змінних для класифікуються об'єктів, неважко переконатися, що всі вони потрапляють в третій клас, так як
- = -26,870,
- = -37,68,
- = -10,809.
Таким чином, ми бачимо, що зміна числа переменниx сильно впливає на результат дискримінантного аналізу. Щоб судити про доцільності включення (видалення) дискримінантної змінної, зазвичай використовують спеціальні статистичні критерії, що дозволяють оцінити значимість погіршення або поліпшення розбиття після включення (видалення) кожної з відібраних змінних.
5. Взаємозв'язок між дискримінантного змінними і дискримінантної функції
Для оцінки внеску окремої змінної в значення дискримінантної функції доцільно користуватися стандартизованими коефіцієнтами дискримінантної функції. Стандартизовані коефіцієнти можна розрахувати двома шляхами:
В· стандартизовать значення вихідних змінних таким чином, щоб їх середні значення були дорівнюють нулю, а 'дисперсії - одиниці;
В· обчислити стандартизовані коефіцієнти виходячи зі значень коефіцієнтів у нестандартній формі:
В·
(28)
де р - загальне число вихідних змінних, т - число груп, - елементи матриці коваріацій:
(29)
де i - номер спостереження, j - номер змінної, k - номер класу, - кількість об'єктів у k - м класі.
Стандартизовані коефіцієнти застосовують у тих випадках, коли потрібно визначити, яка з використовуваних змінних вносить найбільший вклад в величину дискримінантної функції. У прикладі з двома класами, розглянутому вище, дискримінантна функція мала вигляд:
f = -185,03 Х 1 + 1,84 Х 2 + 4,92 Х з .
Отже, найбільший внесок у величину дискримінантної функції вносить змінна X 1 .
Визначимо значення стандартизованих коефіцієнтів і запишемо нове значення дискримінантної функції:
(30)
де =
Стандартизовані коефіцієнти дискримінантної функції теж показують визначальний вплив першої змінної на величину дискримінантної функції.
Крім визначення внеску кожної вихідної змінної в дискримінантної функції, можна проаналізувати і ступінь кореляційної залежності між ними.
Для оцінки тісноти зв'язку між окремими змінними і дискримінантної функції служать коефіцієнти кореляції, які називаються структурними коефіцієнтами. За величиною структурних коефіцієнтів судять про зв'язки між змінними та дискримінантної функції. Структурні коефіцієнти дозволяють також у разі необхідності привласнити ім'я кожної функції. Вони можуть бути розраховані в цілому по всій сукупності об'єктів ( R ) та для кожного класу окремо ( R ).
Покажемо на прикладі 1 розрахунок структурних коефіцієнтів в цілому для трьох класів. Вихідні дані для розрахунку коефіцієнтів представлені в табл. 3. Обчислені структурні коефіцієнти ( R f ) мають наступні значення:
R x 1 f < i> = 0,650 R X 2 f = -0,576 R ХЗ f = -0,506 R x 4 f = -0,951
R x 1 jl < i> = -0,036 R x 2 j 1 = 0,486 R хз jl = -0,211 R x 4 j 1 = 0,217
R x 1 f < i> 2 = -0,728 R x 2 f 2 = 0,878 R ХЗ f 2 = 0,511 R x 4 f 2 = -0,998
R x 1 fJ < i> = -0,713 R х1 J З = 0,258 R хз fJ = -0,122 R x 4 fJ = -0,998.
Таблиця 3 - Вихідні дані
Номер
Х1
Х 2
Х З
Х 4
спостереження
1
0,50
94,0
8,50
6707
-31973,089
2
0,67
75,4
8,79
5037
-18122,238
3
0,68
85,2
9,10
3695
-6930,930
4
0,55
98,8
8,47
6815
-32812,109
5
1,52
81,5
4,95
3211
-13434,229
6
1,20
93,8
6,95
2890
-10812,723
7
1,46
86,5
4,70
2935
-11139,514
8
1,70
...