Зміст
Введення
Глава 1. Множинний регресійний аналіз
Глава 2. Кластерний аналіз
Глава 3. Факторний аналіз
Глава 4. Дискримінантний аналіз
Список використаної літератури
Введення
Вихідна інформація в соціально-економічних дослідженнях представляється найчастіше у вигляді набору об'єктів, кожен з яких характеризується рядом ознак (показників). Оскільки число таких об'єктів і ознак може досягати десятків і сотень, і візуальний аналіз цих даних малоефективний, то виникають завдання зменшення, концентрації вихідних даних, виявлення структури і взаємозв'язки між ними на основі побудови узагальнених характеристик безлічі ознак і безлічі об'єктів. Такі завдання можуть зважитися методами багатовимірного статистичного аналізу.
Багатомірний статистичний аналіз - розділ математичної статистики, присвячений математичним методам, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.
Основна увага в багатовимірному статистичному аналізі приділяється математичним методам побудови оптимальних планів збору, систематизації і обробки даних, спрямованим на виявлення характеру і структури взаємозв'язків між компонентами досліджуваного багатовимірного ознаки і призначеним для отримання наукових і практичних висновків.
Вихідним масивом багатовимірних даних для проведення багатовимірного аналізу зазвичай служать результати вимірювання компонент багатовимірного ознаки для кожного з об'єктів досліджуваної сукупності, тобто послідовність багатовимірних спостережень. Багатомірний ознака найчастіше інтерпретується як величина випадкова, а послідовність спостережень як вибірка з генеральної сукупності. У цьому випадку вибір методу обробки вихідних статистичних даних проводиться на основі тих чи інших припущень щодо природи закону розподілу досліджуваного багатовимірного ознаки.
За змістом багатовимірний статистичний аналіз може бути умовно розбитий на три основні підрозділи:
1. Багатомірний статистичний аналіз багатовимірних розподілів та їх основних характеристик охоплює ситуації, коли оброблювані спостереження мають імовірнісну природу, тобто інтерпретуються як вибірка з відповідною генеральної сукупності. До основним завданням цього підрозділу відносяться: оцінювання статистичне досліджуваних багатовимірних розподілів та їх основних параметрів; дослідження властивостей використовуваних статистичних оцінок; дослідження розподілів ймовірностей для ряду статистик, за допомогою яких будуються статистичні критерії перевірки різних гіпотез про ймовірнісної природою аналізованих багатовимірних даних.
2. Багатомірний статистичний аналіз характеру і структури взаємозв'язків компонент досліджуваного багатовимірного ознаки об'єднує поняття і результати, властиві таким методам і моделям, як регресійний аналіз, дисперсійний аналіз, коваріаційний аналіз, факторний аналіз і т.д. Методи, що належать до цієї групи, включають як алгоритми, засновані на припущенні про ймовірнісної природою даних, так і методи, що не укладаються в рамки будь-якої імовірнісної моделі (останні частіше відносять до методів аналізу даних).
3.Многомерний статистичний аналіз геометричної структури досліджуваної сукупності багатомірних спостережень об'єднує поняття і результати, властиві таким моделям і методам, як дискримінантний аналіз, кластерний аналіз, багатовимірне шкалювання. Вузловим для цих моделей є поняття відстані, або міри близькості між аналізованих елементами як точками деякого простору. При цьому аналізуватися можуть як об'єкти (Як точки, що задаються в признаковом просторі), так і ознаки (як точки, задаються в об'єктному просторі).
Прикладне значення багатовимірного статистичного аналізу полягає в основному у вирішенні наступних трьох завдань:
В· завдання статистичного дослідження залежностей між розглянутими показниками;
В· завдання класифікації елементів (об'єктів або ознак);
В· задача зниження розмірності розглянутого ознакового простору і відбору найбільш інформативних ознак.
Множинний регресійний аналіз призначений для побудови моделі, що дозволяє по значенням незалежних змінних отримувати оцінки значень залежної змінної.
Логістична регресія для вирішення задачі класифікації. Це різновид множинної регресії, призначення якої полягає в аналізі зв'язку між кількома незалежними змінними і залежною змінною.
Факторний аналіз займається визначенням відносно невеликого числа прихованих (латентних) факторів, мінливістю яких пояснюється мінливість всіх спостережуваних показників. Факторний аналіз спрямований на зниження розмірності розглянутій завдання.
Кластерний та дискримінантний аналіз призначені для поділу сукупностей об'єктів на класи, в кожен з яких повинні входити об'єкти в певному сенсі однорідні або близькі. При кластерному аналізі заздалегідь невідомо, скільки вийде груп об'єктів і якого вони будуть обсягу. Дискримінантний аналіз розділяє об'єкти за вже існуючих класів.
Глава 1. Множинний регресійний аналіз
Завдання: Дослідження ринку житла в Орлі (Радянський і Північний райони).
У таблиці наведено дані за ціною квартир в Орлі і за різним чинникам, її обумовлює:
В· ціна;
В· загальна площа;
В· площа кухні;
В· житлова площа;
В· район;
В· поверх;
В· тип будинку;
В· кількість кімнат. (Рис.1)
Рис. 1 Вихідні дані
У графі "Район" використані позначення:
3 - Радянський (елітний, відноситься до центральних районів);
4 - Північний.
У графі В«Тип будинкуВ»:
1 - цегляний;
0 - панельний.
Потрібно:
1. Проаналізувати зв'язок всіх факторів з показником В«ЦінаВ» і між собою. Відібрати фактори, найбільш відповідні для побудови регресійної моделі;
2. Сконструювати фіктивну змінну, що відображає приналежність квартири до центральних і периферійних районах міста;
3. Побудувати лінійну модель регресії для всіх факторів, включивши в неї фіктивну змінну. Пояснити економічний зміст параметрів рівняння. Оцінити якість моделі, статистичну значущість рівняння і його параметрів;
4. Розподілити фактори (крім фіктивної змінної) за ступенем впливу на показник В«ЦінаВ»;
5. Побудувати лінійну модель регресії для найбільш впливових факторів, залишивши в рівнянні фіктивну змінну. Оцінити якість та статистичну значущість рівняння і його параметрів;
6. Обгрунтувати доцільність чи недоцільність включення в рівняння п. 3 і 5 фіктивної змінної;
7. Оцінити інтервальні оцінки параметрів рівняння з імовірністю 95%;
8. Визначити, скільки буде коштувати квартира загальною площею 74,5 м ВІ в елітному (Периферійному) районі.
Виконання:
1. Проаналізувавши зв'язок всіх факторів з показником В«ЦінаВ» і між собою, були відібрані фактори, найбільш підходящі для побудови регресійної моделі, використовуючи метод включення В«ForwardВ»:
А) загальна площа;
Б) район;
В) кількість кімнат.
Включені/виключені змінні (a)
Модель
Включені змінні
Виключені змінні
Метод
1
Загальна площа
.
Включення (критерій: ймовірність F-включення> =, 050)
2
Район
.
Включення (критерій: ймовірність F-включення> =, 050)
3
|