Зміст
Введення
1. Дискримінантні функції та їх геометрична інтерпретація
2. Розрахунок коефіцієнтів дискримінантної функції
3. Класифікація при наявності двох навчальних вибірок
4. Класифікація при наявності k повчальних вибірок
5. Взаємозв'язок між дискримінантного змінними і дискримінантної функції
Висновок
Список використаної літератури
Введення
Д u скр u м u нантний аналіз - це розділ математичної статистики, змістом якого є розробка методів рішення задач розрізнення (дискримінації) об'єктів спостереження за певними ознаками. Наприклад, розбиття сукупності підприємств на декілька однорідних груп за значеннями яких показників виробничо-господарської діяльності.
Методи дискримінантного аналізу знаходять застосування в різних областях: медицині, соціології, психології, економіці і т.д. При спостереженні великих статистичних сукупностей часто з'являється необхідність розділити неоднорідну сукупність на однорідні групи (класи). Таке розчленовування надалі при проведенні статистичного аналізу дає кращі результати моделювання залежностей між окремими ознаками.
Дискримінантний аналіз виявляється дуже зручним і при обробці результатів тестування окремих осіб. Наприклад, при виборі кандидатів на певну посаду можна всіх опитуваних претендентів розділити на дві групи: В«підходитьВ» і В«не підходить В».
Можна привести ще один приклад застосування дискримінантного аналізу в економіці. Для оцінки фінансового стану своїх клієнтів при видачі їм кредиту банк класифікує їх на надійних і не надійних по ряду ознак. Таким чином, в тих випадках, коли виникає необхідність віднесення того або іншого об'єкта до одному з реально існуючих або виділених певним способом класів, можна скористатися дискримінантного аналізу.
Апарат дискримінантного аналізу розроблявся багатьма вченими-фахівцями, починаючи з кінця 50-х років ХХ ст. Дискримінантний аналіз, як і іншими методами багатовимірної статистики, займалися П.Ч. Махаланобіс, Р. Фішер, Г.Хотеллінг і інші видатні вчені.
Всі процедури дискримінантного аналізу можна розбити на дві групи і розглядати їх як абсолютно самостійні методи. Перша група процедур дозволяє інтерпретувати відмінності між існуючими класами, друга - проводити класифікацію нових об'єктів у тих випадках, коли невідомо заздалегідь, до якого з існуючих класів вони належать.
Нехай є безліч одиниць спостереження - генеральна сукупність. Кожна одиниця спостереження характеризується декількома ознаками (змінними) - значення j -й змінної у i -го об'єкта i = 1, ... N; j = 1, ... p.
Припустимо, що всі безліч об'єктів розбито на декілька підмножин (два і більше). З кожної підмножини взята вибірка обсягом , де k - номер підмножини (класи), k = 1, ... , Q .
Ознаки, які використовуються для того, щоб відрізняти один клас (підмножина) від іншого, називаються дискримінантного змінними. Кожна з цих змінних повинна вимірюватися або по інтервального шкалою, або за шкалою відносин. Інтервальна шкала дозволяє кількісно описати відмінності між властивостями об'єктів. Для завдання шкали встановлюються довільна точка відліку і одиниця виміру. Прикладами таких шкал є календарний час, шкали температур і т. п. В якості оцінки положення центру використовуються середня величина, мода і медіана.
Шкала відносин - окремий випадок інтервального шкали. Вона дозволяє співвіднести кількісні характеристики небудь властивості в різних об'єктів, наприклад, стаж роботи, заробітна плата, величина податку.
Теоретично число дискримінантних змінних не обмежена, але на практиці їх вибір повинен здійснюватися на підставі логічного аналізу вихідної інформації і одного з критеріїв, про який мова піде трохи нижче. Число об'єктів спостереження повинне перевищувати число дискримінантних змінних, як мінімум, на два, тобто р < N . дискримінантного змінні повинні бути лінійно незалежними. Ще одним припущенням при дискримінантному аналізі є нормальність закону розподілу багатовимірної величини, тобто кожна з дискримінантних змінних всередині кожного з розглянутих класів повинна бути підпорядкована нормальному закону розподілу. У разі, коли реальна картина у вибіркових сукупностях відрізняється від висунутих передумов, слід вирішувати питання про доцільність використання процедур дискримінантного аналізу для класифікації нових спостережень, так як в цьому випадку утрудняються розрахунки кожного критерію класифікації.
1. Дискримінантні функції та їх геометрична інтерпретація
Перед тим як приступити до розгляду алгоритму дискримінантного аналізу, звернемося до його геометричної інтерпретації. На рис. 1 зображені об'єкти, що належать двом різним множинам М 1 і М 2 .
Рис.1 Геометрична інтерпретація дискримінантної функції та дискримінантних змінних
Кожен об'єкт характеризується в цьому випадку двома змінними та . Якщо розглядати проекції об'єктів (точок) на кожну вісь, то ці множини перетинаються, тобто по кожній змінної окремо деякі об'єкти обох множин мають подібні характеристики. Щоб найкращим чином розділити два розглянутих безлічі, потрібно побудувати відповідну лінійну комбінацію змінних та . Для двовимірного простору ця задача зводиться до визначення нової системи координат. Причому нові осі L та З повинні бути розташовані таким чином, щоб проекції об'єктів, що належать різним множинам на вісь L , були максимально розділені. Вісь С перпендикулярна осі L та розділяє два В«хмариВ» точок найкращим чином, Т.е. щоб безлічі виявилися по різні сторони від цієї прямої. При цьому ймовірність помилки класифікації повинна бути мінімальною. Сформульовані умови повинні бути враховані при визначенні коефіцієнтів і наступної функції:
F (x) = + (1)
Функція F (x) називається канонічної дискримінантної функцією, а величини та - Дискримінантний змінними.
Позначимо - середнє значення j -го ознаки у об'єктів i -го безлічі (Класу). Тоді для безлічі М 1 середнє значення функції (x) буде дорівнює:
(x) = +, (2)
Для безлічі М 2 середнє значення функції дорівнює:
(x) = +, (3)
Геометрична інтерпретація цих функцій - дві паралельні прямі, що проходять через центри класів (множин) (рис.2).
Рис. 2. Центри поділюваних множин і константа дискримінації
дискримінантного функція може бути як лінійною, так і нелінійною. Вибір її виду залежить від геометричного розташування поділюваних класів в просторі дискримінантних змінних. Для спрощення викладок надалі розглядається лінійна дискримінантна функція.
2. Розрахунок коефіцієнтів дискримінантної функції
Коефіцієнти дискримінантної функції визначаються таким чином, щоб (x) і (x) якомога більше різнилися між собою, тобто щоб для двох множин (Класів) було максимальним вираз
<...