ою компактної запису вибіркових даних двовимірної випадкової величини:
...
...
...
...
...
...
...
...
...
...
...
...
n
де
;
- впорядковані за зростанням послідовності всіх різних значень, відповідно, наявних у вибірці.
- кількість пар.
- сума елементів-го стовпця, відповідно - ой рядки кореляційної таблиці. При цьому
.
Точкові оцінки параметрів двовимірного розподілу
Для отримання наближених значень параметрів кореляційної моделі використовують, як правило, метод моментів, розрахунки виробляють згідно наступних формулах.
Характеристики розподілу випадкового вектора
теоретичні
оцінки за вибірковими даними
-->>
згрупованим
НЕ згрупованим
Наведені емпіричні характеристики двовимірного нормального закону розподілу випадкового вектора про бладают властивістю спроможності,, є, крім того, незміщеними і ефективними оцінками.
Апроксимація рівнянь регресії
;.
Перевірка гіпотези про відсутність кореляційної залежності між випадковими величинами
Вибірковий парний коефіцієнт кореляції r , знайдений за кінцевим числом статистичних даних, практично завжди відмінний від нуля, однак, звідси не завжди випливає, що невідомий генеральний парний коефіцієнт кореляції ПЃ також не дорівнює нулю, тобто що кореляційна залежність дійсно має місце. Потрібно додатково здійснити перевірку припущення про значимість коефіцієнта кореляції.
При справедливості основної гіпотези ("кореляційна залежність між, відсутня ") статистика застосовуваного критерію
має розподіл Стьюдента з числом ступенів свободи, рівним.
При рівні значущості гіпотеза відкидається, якщо виконується нерівність, в якому під символом розуміється критичне значення, яке задовольняє рівнянню
.
При відкиданні основний гіпотези укладають, що ознаки, пов'язані лінійним кореляційним співвідношенням, в іншому випадку роблять висновок, що на основі наявної вибірки кореляційна залежність між ними не встановлена.
Якщо в результаті перевірки гіпотеза буде відкинута, то вважають, що коефіцієнт кореляції значимо (Суттєво) відрізняється від нуля, а розраховане за статистичними даними значення r може бути використано в якості його точкової оцінки.
Інтервальна оцінка коефіцієнта кореляції
кореляційна регресія рівняння математичний
При побудові довірчого інтервалу для невідомого коефіцієнта кореляції використовується спеціальна функція - перетворення Фішера (гіперболічний арктангенс) вибіркового коефіцієнта кореляції r :
.
- зростаюча непарна функція: z (- r ) = - z ( r ) .
Розподіл ймовірностей значень наближається (Тим більше точно, чим більше обсяг вибірки n ) нормальним розподілом ймовірностей з параметрами:
і.
Статистика має асимптотичний стандартний нормальний розподіл.
асимптотично точний довірчий інтервал надійності для нормованого відхилення z :
,
де - квантиль рівня розподілу, тобто корінь рівняння.
Довірчий інтервал для математичного очікування:
.
Величиною у вираженні можна знехтувати, приймаючи до уваги, що вона при їсти нескінченно мала більш високого порядку в порівнянні з.
Довірчий інтервал для гіперболічного арктангенс коефіцієнта кореляції:
.
Рішення щодо даного подвійного нерівності призводить до шуканого довірчого інтервалу для коефіцієнта кореляції:
,
з кордонами, обумовленими як значення гіперболічного тангенса для значень, рівних відповідно та.
Функція задає перетворення, зворотне-перетворенню Фішера. Отже,.
Етапи визначення ДІ для коефіцієнта кореляції
- знаходиться вибірковий коефіцієнт кореляції r
- виконується пряме перетворення Фішера значення r :
- вибирається квантиль, виходячи з умови;
- обчислюються значення і;
- за допомогою зворотного перетворення Фішера знаходяться межі ДІ:
і.
Довірчі інтервали для коефіцієнтів регресії
Їх побудова здійснюється відповідно до загальної схемою. При цьому використовуються статистики:
;,
мають розподіл Стьюдента з числом ступенів свободи, рівному.
;
,
де - корінь рівняння.
Багатовимірна кореляційна модель
Передбачається, що спільне розподіл аналізованих випадкових змінних (ознак) підпорядковане h -мірному нормальному закону.
Типові завдання
ВЁ визначення тісноти зв'язку між деякими змінними при фіксуванні або виключення впливу інших змінних;
ВЁ визначення тісноти зв'язку однієї з розглянутих змінних з сукупністю всіх інших змінних, включених в аналіз.
Кореляційна матриця
Початковий етап багатовимірного кореляційного аналізу кількісних ознак полягає в оцінці (наближен...