Главная > Экономико-математическое моделирование > Багатомірний статистичний аналіз в системі SPSS

Багатомірний статистичний аналіз в системі SPSS


25-01-2012, 11:47. Разместил: tester9

Зміст

Введення

Глава 1. Множинний регресійний аналіз

Глава 2. Кластерний аналіз

Глава 3. Факторний аналіз

Глава 4. Дискримінантний аналіз

Список використаної літератури


Введення

Вихідна інформація в соціально-економічних дослідженнях представляється найчастіше у вигляді набору об'єктів, кожен з яких характеризується рядом ознак (показників). Оскільки число таких об'єктів і ознак може досягати десятків і сотень, і візуальний аналіз цих даних малоефективний, то виникають завдання зменшення, концентрації вихідних даних, виявлення структури і взаємозв'язки між ними на основі побудови узагальнених характеристик безлічі ознак і безлічі об'єктів. Такі завдання можуть зважитися методами багатовимірного статистичного аналізу.

Багатомірний статистичний аналіз - розділ математичної статистики, присвячений математичним методам, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.

Основна увага в багатовимірному статистичному аналізі приділяється математичним методам побудови оптимальних планів збору, систематизації і обробки даних, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.

Вихідним масивом багатовимірних даних для проведення багатовимірного аналізу зазвичай служать результати вимірювання компонент багатовимірного ознаки для кожного з об'єктів досліджуваної сукупності, тобто послідовність багатовимірних спостережень. Багатомірний ознака найчастіше інтерпретується як величина випадкова, а послідовність спостережень як вибірка з генеральної сукупності. У цьому випадку вибір методу обробки вихідних статистичних даних проводиться на основі тих чи інших припущень щодо природи закону розподілу досліджуваного багатовимірного ознаки.

За змістом багатовимірний статистичний аналіз може бути умовно розбитий на три основні підрозділи:

1. Багатомірний статистичний аналіз багатовимірних розподілів та їх основних характеристик охоплює ситуації, коли оброблювані спостереження мають імовірнісну природу, тобто інтерпретуються як вибірка з відповідною генеральної сукупності. До основним завданням цього підрозділу відносяться: оцінювання статистичне досліджуваних багатовимірних розподілів та їх основних параметрів; дослідження властивостей використовуваних статистичних оцінок; дослідження розподілів ймовірностей для ряду статистик, за допомогою яких будуються статистичні критерії перевірки різних гіпотез про ймовірнісної природою аналізованих багатовимірних даних.

2. Багатомірний статистичний аналіз характеру і структури взаємозв'язків компонент досліджуваного багатовимірного ознаки об'єднує поняття і результати, властиві таким методам і моделям, як регресійний аналіз, дисперсійний аналіз, коваріаційний аналіз, факторний аналіз і т.д. Методи, що належать до цієї групи, включають як алгоритми, засновані на припущенні про ймовірнісної природою даних, так і методи, що не укладаються в рамки будь-якої імовірнісної моделі (останні частіше відносять до методів аналізу даних).

3.Многомерний статистичний аналіз геометричної структури досліджуваної сукупності багатомірних спостережень об'єднує поняття і результати, властиві таким моделям і методам, як дискримінантний аналіз, кластерний аналіз, багатовимірне шкалювання. Вузловим для цих моделей є поняття відстані, або міри близькості між аналізованих елементами як точками деякого простору. При цьому аналізуватися можуть як об'єкти (Як точки, що задаються в признаковом просторі), так і ознаки (як точки, задаються в об'єктному просторі).

Прикладне значення багатовимірного статистичного аналізу полягає в основному у вирішенні наступних трьох завдань:

В· завдання статистичного дослідження залежностей між розглянутими показниками;

В· завдання класифікації елементів (об'єктів або ознак);

В· задача зниження розмірності розглянутого ознакового простору і відбору найбільш інформативних ознак.

Множинний регресійний аналіз призначений для побудови моделі, що дозволяє по значенням незалежних змінних отримувати оцінки значень залежної змінної.

Логістична регресія для вирішення задачі класифікації. Це різновид множинної регресії, призначення якої полягає в аналізі зв'язку між кількома незалежними змінними і залежною змінною.

Факторний аналіз займається визначенням відносно невеликого числа прихованих (латентних) факторів, мінливістю яких пояснюється мінливість всіх спостережуваних показників. Факторний аналіз спрямований на зниження розмірності розглянутій завдання.

Кластерний та дискримінантний аналіз призначені для поділу сукупностей об'єктів на класи, в кожен з яких повинні входити об'єкти в певному сенсі однорідні або близькі. При кластерному аналізі заздалегідь невідомо, скільки вийде груп об'єктів і якого вони будуть обсягу. Дискримінантний аналіз розділяє об'єкти за вже існуючих класів.


Глава 1. Множинний регресійний аналіз

Завдання: Дослідження ринку житла в Орлі (Радянський і Північний райони).

У таблиці наведено дані за ціною квартир в Орлі і за різним чинникам, її обумовлює:

В· ціна;

В· загальна площа;

В· площа кухні;

В· житлова площа;

В· район;

В· поверх;

В· тип будинку;

В· кількість кімнат. (Рис.1)

Рис. 1 Вихідні дані

У графі "Район" використані позначення:

3 - Радянський (елітний, відноситься до центральних районів);

4 - Північний.

У графі В«Тип будинкуВ»:

1 - цегляний;

0 - панельний.

Потрібно:

1. Проаналізувати зв'язок всіх факторів з показником В«ЦінаВ» і між собою. Відібрати фактори, найбільш відповідні для побудови регресійної моделі;

2. Сконструювати фіктивну змінну, що відображає приналежність квартири до центральних і периферійних районах міста;

3. Побудувати лінійну модель регресії для всіх факторів, включивши в неї фіктивну змінну. Пояснити економічний зміст параметрів рівняння. Оцінити якість моделі, статистичну значущість рівняння і його параметрів;

4. Розподілити фактори (крім фіктивної змінної) за ступенем впливу на показник В«ЦінаВ»;

5. Побудувати лінійну модель регресії для найбільш впливових факторів, залишивши в рівнянні фіктивну змінну. Оцінити якість та статистичну значущість рівняння і його параметрів;

6. Обгрунтувати доцільність чи недоцільність включення в рівняння п. 3 і 5 фіктивної змінної;

7. Оцінити інтервальні оцінки параметрів рівняння з імовірністю 95%;

8. Визначити, скільки буде коштувати квартира загальною площею 74,5 м ВІ в елітному (Периферійному) районі.

Виконання:

1. Проаналізувавши зв'язок всіх факторів з показником В«ЦінаВ» і між собою, були відібрані фактори, найбільш підходящі для побудови регресійної моделі, використовуючи метод включення В«ForwardВ»:

А) загальна площа;

Б) район;

В) кількість кімнат.

Включені/виключені змінні (a)

Модель Включені змінні Виключені змінні Метод 1 Загальна площа . Включення (критерій: ймовірність F-включення> =, 050) 2 Район . Включення (критерій: ймовірність F-включення> =, 050) 3 Кількість кімнат . Включення (критерій: ймовірність F-включення> =, 050)

a Залежна змінна: Ціна

2. Змінна Х4 В«РайонВ» є фіктивною змінною, так як має 2 значення: 3-приналежність до центрального району В«РадянськийВ», 4 - до периферійного району В«ПівнічнийВ».

3. Побудуємо лінійну модель регресії для всіх факторів (включаючи фіктивну змінну Х4).

Отримана модель:

У = 348,349 + 35,788 Х1 -217,075 Х4 +305,687 Х7

Оцінка якості моделі.

Коефіцієнт детермінації R2 = 0,807

Показує частку варіації результативної ознаки під впливом досліджуваних факторів. Отже, близько 89% варіації залежної змінної враховано і обумовлено в моделі впливом включених факторів.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язку між залежною змінною У з усіма включеними в модель пояснюючими факторами.

Стандартна помилка = 126,477

Коефіцієнт Дарбіна - Уотсона = 2,136

Перевірка значущості рівняння регресії

Значення критерію F-Фішера = 41,687

Рівняння регресії слід визнати адекватним, модель вважається значущою.

Самий значимий фактор - кількість кімнат (F = 41,687)

Другий за значимістю фактор-загальна площа (F = 40,806)

Третій за значимістю фактор-район (F = 32,288)

4. Побудуємо лінійну модель регресію з усіма факторами (крім фіктивної змінної Х4)

За ступеня впливу на показник В«ЦінаВ» розподілили:

Самий значимий фактор - загальна площа (F = 40,806)

Другий за значимістю фактор-яка кількість кімнат (F = 29,313)

5. Включені/виключені змінні

Модель Включені змінні Виключені змінні Метод 1 Загальна площа . Включення (критерій: ймовірність F-включення> =, 050) 2 Район . Включення (критерій: ймовірність F-включення> =, 050) 3 Кількість кімнат . Включення (критерій: ймовірність F-включення> =, 050)

a Залежна змінна: Ціна

6. Побудуємо лінійну модель регресії для найбільш впливових факторів з фіктивною змінною, в нашому випадку вона і є одним з впливових чинників.

Отримана модель:

У = 348,349 + 35,788 Х1 -217,075 Х4 +305,687 Х7

Оцінка якості моделі.

Коефіцієнт детермінації R2 = 0,807

Показує частку варіації результативної ознаки під впливом досліджуваних факторів. Отже, близько 89% варіації залежної змінної враховано і обумовлено в моделі впливом включених факторів.

Коефіцієнт множинної кореляції R = 0,898

Показує тісноту зв'язку між залежною змінною У з усіма включеними в модель пояснюючими факторами.

Стандартна помилка = 126,477

Коефіцієнт Дарбіна - Уотсона = 2,136

Перевірка значущості рівняння регресії

Значення критерію F-Фішера = 41,687

Рівняння регресії слід визнати адекватним, модель вважається значущою.

Самий значимий фактор - кількість кімнат (F = 41,687)

Другий за значимістю фактор-загальна площа (F = 40,806)

Третій за значимістю фактор-район (F = 32,288)

7. Фіктивна змінна Х4 є значимим чинником, тому доцільно включити її в рівняння.

Інтервальні оцінки параметрів рівняння показують результати прогнозування за моделлю регресії.

З імовірністю 95% обсяг реалізації в прогнозованому місяці складе від 540,765 до 1080,147 млн. крб.

8. Визначення вартості квартири в елітному районі

Для 1 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 1

Для 2 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 2

Для 3 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 3 + 305,687 * 3

в периферійному

Для 1 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 1

Для 2 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 2

Для 3 кімн У = 348,349 + 35,788 * 74, 5 - 217,075 * 4 + 305,687 * 3

Глава 2. Кластерний аналіз

Завдання: Дослідження структури грошових витрат і заощаджень населення.

У таблиці представлена структура грошових витрат і заощаджень населення по регіонах Центрального федерального округу Російської федерації в 2003 р. Для наступних показників:

В· ПТіОУ - покупка товарів і оплата послуг;

В· ОПІВ - обов'язкові платежі та внески;

В· ПН - придбання нерухомості;

В· ПФА - приріст фінансових активів;

В· ДР - приріст (Зменшення) грошей на руках у населення.


Рис. 8 Вихідні дані

Потрібно:

1) визначити оптимальну кількість кластерів для розбиття регіонів на однорідні групи за всім группіровочним ознаками одночасно;

2) провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати у вигляді дендрограмми;

3) проаналізувати основні пріоритети грошових витрат і заощаджень в отриманих кластерах;

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

Виконання:

1) Визначити оптимальну кількість кластерів для розбиття регіонів на однорідні групи за всім группіровочним ознаками одночасно;

Для визначення оптимальної кількості кластерів потрібно скористатися ієрархічної кластерним аналізом і звернутися до таблиці В«Кроки агломераціїВ» до стовпцю В«КоефіцієнтиВ».

Ці коефіцієнти подразумевают відстань між двома кластерами, визначену на підставі обраної дистанційної заходи (Евклідів відстань). На тому етапі, коли міра відстані між двома кластерами збільшується стрибкоподібно, процес об'єднання в нові кластери необхідно зупинити.

У підсумку, оптимальним вважається число кластерів, рівне різниці кількості спостережень (17) і номери кроку (14), після якого коефіцієнт збільшується стрибкоподібно. Таким чином, оптимальна кількість кластерів дорівнює 3. (Рис.9)

статистичний математичний аналіз кластерний

Рис. 9 Таблиця В«Кроки агломераціїВ»

2) Провести класифікацію областей ієрархічним методом з алгоритмом міжгрупових зв'язків і відобразити результати у вигляді дендрограмми;

Тепер, використовуючи оптимальну кількість кластерів, проводимо класифікацію областей ієрархічним методом. І у вихідних даних звертаємося до таблиці В«Належність до кластерівВ». (Рис.10)


Рис. 10 Таблиця В«Належність до кластерівВ»

На Рис. 10 чітко видно, що в 3 кластер потрапили 2 області (Калузька, Московська) і м. Москва, у 2 кластер дві (Брянська, Воронезька, Івановська, Липецька, Орловська, Рязанська, Смоленська, Тамбовська, Тверська), в 1 кластер - Білгородська, Володимирська, Костромська, Курська, Тульська, Ярославська.


Рис. 11 Дендрограмма

3) проаналізувати основні пріоритети грошових витрат і заощаджень, в отриманих кластерах;

Для аналізу отриманих кластерів нам потрібно провести В«Порівняння середніхВ». У вихідному вікні виводиться наступна таблиця (Мал. 12)

Рис. 12 Середні значення змінних

У таблиці В«Середніх значень В»ми можемо простежити, яким структурам віддається найбільший пріоритет в розподілі грошових витрат і заощаджень населення.

В першу чергу варто відзначити, що найвищий пріоритет у всіх областях віддається покупці товарів і оплату послуг. Більше значення параметр приймає в 3 кластері.

2 місце з...аймає приріст фінансових активів. Найбільше значення в 1 кластері.

Найменший коефіцієнт в 1 і 2 кластерах у В«придбання нерухомостіВ», а в 3 кластері виявлено помітне зменшення грошей на руках у населення.

В цілому особливе значення для населення має покупка товарів і оплата послуг та незначне покупка нерухомості.

4) порівняти отриману класифікацію з результатами застосування алгоритму внутрішньогрупових зв'язків.

В аналізі міжгрупових зв'язків ситуація практично не змінилася, за винятком Тамбовської області, яка з 2 кластера потрапила в 1. (Рис.13)

Рис. 13 Аналіз внутрішньогрупових зв'язків

У таблиці В«Середніх значень В»ніяких змін не відбулося.

Глава 3. Факторний аналіз

Завдання: Аналіз діяльності підприємств легкої промисловості.

Є дані обстежень 20 підприємств легкої промисловості (Мал. 14) за наступними характерними ознаками:

В· Х1 - рівень фондовіддачі;

В· Х2 - трудомісткість одиниці продукції;

В· Х3 - питома вага закупівельних матеріалів в загальних витратах;

В· Х4 - коефіцієнт змінності устаткування;

В· Х5 - премії і винагороди на одного працівника;

В· Х6 - питома вага втрат від браку;

В· Х7 - середньорічна вартість основних виробничих фондів;

В· Х8 - середньорічний фонд заробітної плати;

В· Х9 - рівень реалізованості продукції;

В· Х10 - індекс постійного активу (відношення основних засобів та інших необоротних активів до власних коштів);

В· Х11 - оборотність оборотних коштів;

В· Х12 - невиробничі витрати.


Рис.14 Вихідні дані

Потрібно:

1. провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити й інтерпретувати факторні ознаки;

2. вказати найбільш благополучніші і перспективні підприємства.

Виконання:

1. Провести факторний аналіз наступних змінних: 1,3,5-7, 9, 11,12, виявити і інтерпретувати факторні ознаки.

Факторний аналіз - це сукупність методів, які на основі реально існуючих зв'язків об'єктів (Ознак) дозволяють виявити латентні (неявні) узагальнюючі характеристики організаційної структури.

У діалоговому вікні факторного аналізу вибираємо наші змінні, вказуємо необхідні параметри.


Рис. 15 Повна пояснена дисперсія

По таблиці В«Повної пояснене дисперсії В»видно, що виділені 3 фактори, що пояснюють 74,8% варіацій змінних - побудована модель досить хороша.

Тепер інтерпретуємо факторні ознаки по В«Матриці повернутих компонентВ»: (Рис.16).

Рис. 16 Матриця повернутих компонент

Фактор 1 найбільш тісно пов'язаний з рівнем реалізації продуктів і має зворотну залежність від невиробничих витрат.

Фактор 2 найбільш тісно пов'язаний з питомою вагою закупівельних матеріалів в загальних витратах і питомою вагою втрат від браку і має зворотну залежність від премій і винагород на одного працівника.

Фактор 3 найбільш тісно пов'язаний з рівнем фондовіддачі і оборотність оборотних коштів і має зворотну залежність від середньорічної вартості основних виробничих фондів.

2. Вказати найбільш благополучніші і перспективні підприємства.

Для того, щоб виявити найбільш благополучні підприємства проведемо сортування даних по 3 факторним ознаками за спаданням. (Рис.17)

Рис. 17

Найбільш благополучними підприємствами слід вважати: 13,4,5, так як в цілому по 3 факторам їх показники займають найбільш високі і стабільні позиції.


Глава 4. Дискримінантний аналіз

Оцінка кредитоспроможності юридичних осіб в комерційному банку

В якості значущих показників, що характеризують фінансовий стан організацій-позичальників, банком обрані шість показників (табл. 4.1.1):

QR (Х1) - коефіцієнт термінової ліквідності;

CR (Х2) - коефіцієнт поточної ліквідності;

EQ/TA (Х3) - коефіцієнт фінансової незалежності;

TD/EQ (Х4) - сумарні зобов'язання до власного капіталу;

ROS (Х5) - рентабельність продажів;

FAT (Х6) - оборотність основних засобів.

Таблиця 4.1.1. Вихідні дані

Позичальник QR CR EQ/TA TD/EQ ROS,% FAT, раз 1 0,614 2,982 0,592 0,303 13,179 2,712 2 8,604 4,496 0,284 0,109 17,181 10,115 3 6,207 4,423 0,366 0,228 15,385 2,151

Потрібно:

На основі дискримінантного аналізу з використанням пакета SPSS визначити, до якої з чотирьох категорій відносяться три позичальника (юридичних особи), які бажають отримати кредит у комерційному банку:

- Група 1 - з відмінними фінансовими показниками;

- Група 2 - з хорошими фінансовими показниками;

-

-

Хід виконання:

Для того щоб

1

2 3

Рис. Коефіцієнти
18 10 3 4

Рис. 4.1.2.

Дані таблиці

Рис. 4.1.3. Результати класифікації

В результаті 3 0,99 3 1 3 1 3 1

Рис. статистика

Вони

1

2 3 1 2 3 4

Рис. 4.1.5.

Рис. 4.1.6.

Рис. 4.1.7.

На рис. показниками.ї частини графіка розташовані позичальники з вищими показниками, в лівій - з низькою, а в середній частині - з середніми фінансовими показниками. Оскільки за результатами розрахунку другого дискримінантна функція D2 (X) виявилася незначущі, то відмінності координат центроїдів по цій осі незначні.

Оцінка кредитоспроможності фізичних осіб в комерційному банку

Кредитний відділ комерційного банку провів вибіркове обстеження 30 своїх кліє...нтів (Фізичних осіб). На основі попереднього аналізу даних, позичальники оцінювалися за шістьма показниками (табл. 4.2.1):

Х1 - позичальник брав кредит в комерційних банках раніше;

Х2 - середньомісячний дохід сім'ї позичальника, тис. руб.;

Х3 - термін (період) погашення кредиту, років;

Х4 - розмір виданого кредиту, тис. руб.;

Х5 - склад сім'ї позичальника, чол.;

Х6 - вік позичальника, років.

При цьому по ймовірності повернення кредиту виявлені три групи позичальників:

- Група 1 - з низькою ймовірністю погашення кредиту;

- Група 2 - зі середньої ймовірністю погашення кредиту;

- Група 3 - з високою ймовірністю погашення кредиту.

Потрібно:

На основі дискримінантного аналізу з використанням пакета SPSS необхідно класифікувати трьох клієнтів банку (по ймовірності погашення кредиту), тобто оцінити належність кожного з них до однієї з трьох груп. За результатами розрахунку побудувати значимі дискримінантних функцій, їх значимість оцінити по коефіцієнту Уїлкса (О»). У просторі двох дискримінантних функцій для кожної групи побудувати діаграми взаємного розташування спостережень і об'єднану діаграму. Оцінити місце розташування кожного позичальника на цих діаграмах. Виконати інтерпретацію результатів проведеного аналізу.

Таблиця 4.2.1. Вихідні дані

Позичальник Брався Чи кредит раніше (1 - так, 2 - ні) Середньомісячний дохід сім'ї позичальника, тис. руб. Період погашення кредиту, років Розмір кредиту, тис. руб. Склад сім'ї позичальника, чол. Вік позичальника, років 1 1 36,47 10 450 6 43 2 1 47,37 3 260 4 52 3 1 46,85 9 470 3 44

Хід виконання:

Для побудови дискримінантного аналізу в якості залежної змінної виберемо ймовірність своєчасного погашення кредиту клієнтом. Враховуючи, що вона може бути низькою, середньої і високої, кожній категорії привласнимо відповідну оцінку 1,2 і 3.

Ненормовані канонічні коефіцієнти дискримінантних функцій, наведені на рис. 4.2.1, використовуються для побудови рівняння дискримінантних функцій D1 (X), D2 (X):

1.) D1 (X) =

2.) D2 (X) =

Функція 1 2 Брався Чи кредит раніше -2,566 3,291 Середньомісячний дохід сім'ї , 290 , 151 Період погашення кредиту , 009 , 631 Розмір кредиту , 008 -, 009 Склад сім'ї позичальника, чол -, 876 -, 231 Вік позичальника, років , 032 , 044 (Константа) -4,286 -11,943

Рис. 4.2.1. Коефіцієнти канонічної дискримінантної функції

Перевірка функції (й) Лямбда Уїлкса Хі-квадрат ст.св. Знч. від 1 до 2 , 104 55,549 12 , 000 2 , 759 6,757 5 , 239

Рис. 4.2.2. Лямбда Уїлкса

За коефіцієнтом Уїлкса (Рис. 4.2.2) для другої функції значимість більш 0.001, отже, її для дискримінації використовувати недоцільно.

Дані таблиці В«Результати класифікаціїВ» (рис. 4.2.3) свідчать про те, що для 93,3% спостережень класифікація проведена коректно, висока точність досягнута в першій і другій групах (100% і 91,7%), менш точні результати отримані в третій групі (88, 9%).


Рис. 4.2.3. Результати класифікації

Інформація про фактичні і передвіщених групах для кожного клієнта наведені в таблиці В«поточечной статистики В»(рис. 4.2.4).

В результаті дискримінантного аналізі високою ймовірністю визначена приналежність нових клієнтів банку до обучающему підмножині М3 - перший, другий і третій клієнт (Порядковий номер 31, 32, 33) віднесено до підмножини М3 з відповідними ймовірностями 99%, 99% і 100%.

Номер спостереження Фактична група найімовірнішого група Передбачений група P (D> d | G = g) P (G = g | D = d) p ст.св. 1 2 2 0,720783301 2 0,97638652 ... ... ... ... ... ... 31 не GROUP 3 0,728612614 2 0,999624597 32 не GROUP 3 0,000220059 2 0,999999998 33 не GROUP 3 1,52747 E-09 2 1

Рис. 4.2.4. Поточечной статистика

Імовірність погашення кредиту Функція 1 2 1 -2,873 , 503 ... 2 -, 289 -, 652 3 3,258 , 366

Рис. 4.2.5. Функції в центроїдів груп

Координати центроїдів по групам наведено в таблиці В«Функції в центроїдів групВ» (рис. 4.2.5). Вони використовуються для нанесення центроїдів на карту сприйняття (рис. 4.2.6).

Поле В«Територіальної карти В»розділене дискримінантної функції на три області: в лівій частині знаходяться переважно спостереження першої групи клієнтів з дуже низькою ймовірністю погашення кредиту, в правій частині - третьої групи з високою ймовірністю, в середній - другої групи клієнтів із середньою ймовірністю повернення кредиту відповідно.

На рис. 4.2.7 (а - в) відображено розташування клієнтів кожної з трьох груп на площині двох дискримінантних функцій D1 (X) і D2 (X). За цими графіками можна проводити детальний аналіз ймовірності погашення кредиту всередині кожної групи, судити про характер розподілу клієнтів і оцінювати ступінь їх віддаленості від відповідного центроїда.


Рис. 4.2.6. Карта сприйняття для трьох дискримінантних функцій D1 (X) і D2 (X) (* - центроїд групи)

Так само на рис. 4.2.7 (г) в тій же системі координат наведено об'єднаний графік розподілу всіх груп клієнтів разом зі своїми центроїдів; його можна використовувати для проведення порівняльного візуального аналізу характеру взаємного розташування груп клієнтів банку з різними ймовірностями погашення кредиту. У лівій частині графіка розташовані позичальники з високою ймовірністю погашення кредиту, в правій - З низькою, а в середній частині - з середньою ймовірністю. Оскільки по результатами розрахунку другого дискримінантна функція D2 (X) виявилася незначущі, то відмінності координат центроїдів по цій осі незначні.


б)

г)

а)

в)

Рис. 4.2.7. Розташування спостережень на площині двох дискримінантних функцій для груп з низькою (а), середньої (б), високої (с) ймовірністю погашення кредиту та для всіх груп (р)


Список літератури

1. В«Багатомірний статистичний аналіз в економічних задачах. Комп'ютерне моделювання в SPSS В», Вузівський підручник, 2009 р.

2. Орлов А.І. В«Прикладна статистика В»М.: ВидавництвоВ« Іспит В», 2004

3. Фішер Р.А. В«Статистичні методи для дослідників В», 1954 р.

4. Калініна В.М., Соловйов В.І. В«Введення в багатомірний статистичний аналізВ» Навчальний посібник ГУУ, 2003;

5. Ахім Бююль, Петер Цефель, В«SPSS: мистецтво обробки інформаціїВ» Вид-во DiaSoft, 2005р.;

6. ru.wikipedia.org/wiki