Контрольна робота
з дисципліни "Економетрика"
студента гр. ВФ-108
Звягіна Марії Михайлівни
Розділ I. Практична частина
Зміст завдань.
Завдання 1
1. За вихідними даними виконати кореляційний аналіз:
Таблиця 9
Основні показники роботи вантажних автомобілів великих і середніх організацій автомобільного транспорту в 2006 році
Перевезено вантажів, тис. тонн
Витрати, млн, крб
Володимирська
594,6
258,3
Брянська
3178,9
656,5
Білгородська
523,8
824,4
Воронезька
2572,3
220,1
Іванівська
308,5
73,8
Костромська
580,5
82,7
Рязанська
203,7
65,4
Смоленська
389,3
86,6
Тульська
225,8
36,5
Ярославська
693,4
279,9
Основним завданням кореляційного аналізу є - виявлення зв'язку між випадковими змінними та оцінка її тісноти. Показником тісноти лінійної зв'язку є коефіцієнт кореляції r .
1.1. Побудувати кореляційне поле і запропонувати гіпотезу про зв'язок досліджуваних факторів
Для трактування лінійного зв'язку між змінної X ("Перевезено вантажів") і Y ("Витрати") за допомогою вбудованих можливостей Microsoft Excel побудуємо поле кореляції заданої вибірки спостережень (діаграма 1).
кореляційний регресійний аналіз
Характер розташування точок на діаграмі дозволяє зробити попередній висновок про те, що зв'язок між змінними пряма, тобто збільшення однієї із змінних веде збільшенню умовної (груповий) середньої інший.
Зв'язок між змінними в діапазоні досить тісний, однак в діапазоні маються точки викиду, тобто точки, знаходяться на досить віддаленій відстані від загального масиву точок. Їм відповідають дані по Брянській, Білгородській і Воронезькій областях.
Діаграма 1.
Зробимо припущення, що:
1. дані по Брянській області є точкою викиду;
2. дані по Білгородській області є точкою викиду;
3. дані по Воронезькій області є точкою викиду;
4. дані по Брянській і Білгородській областях є точками викиду;
5. дані по Брянській і Воронезькій областях є точками викиду;
6. дані по Білгородській і Воронезькій областях є точками викиду
7. дані по Брянській, Білгородській і Воронезькій областях є точками викиду.
1.2. Визначити коефіцієнти кореляції
Для заданого масиву змінних коефіцієнт кореляції r = 0,454 (розрахований за допомогою функції Microsoft Excel корелят).
Коефіцієнт кореляції r > 0, отже, кореляційний зв'язок між змінними пряма, що підтверджує попередній висновок, зроблений в п.1.1.
Коефіцієнт кореляції r прийняв значення на відрізку [-1; 1], отже, ми можемо оцінити тісноту зв'язку випадкових величин, заданих масивами, за допомогою шкали Чеддока:
Тіснота зв'язку
Значення коефіцієнта кореляції при наявності:
прямого зв'язку
зворотного зв'язку
Слабка
0,1 - 0,3
(-0,1) - (-0,3)
Помірна
0,3 - 0,5
(-0,3) - (-0,5)
Помітна
0,5 - 0,7
(-0,5) - (-0,7)
Висока
0,7 - 0,9
(-0,7) - (-0,9)
Вельми висока
0,9 - 0,99
(-0,9) - (-0,99)
Коефіцієнт кореляції r належить інтервалу (0,3; 0,5), отже, зв'язок між змінними помірна.
Розрахуємо коефіцієнти кореляції, виключаючи дані по суб'єктам РФ згідно висунутим припущенням:
r = 0,116
r = 0,821
r = 0,578
r = 0,511
r = 0,455
r = 0,949
r = 0,824
Аналіз отриманих коефіцієнтів показує, що припущення 5 вірно, тобто дані по Брянській і Білгородській областях є точками викиду (Виняток точок, відповідних вказаним суб'єктам РФ, з кореляційного поля не спричинило за собою значної зміни коефіцієнта кореляції). Всі інші припущення вважаємо невірними. Крім того, відзначається значне збільшення тісноти зв'язку між змінними при виключенні з кореляційного поля точок, відповідних даними по Білгородській і Воронезькій областях (припущення 6), і її значне зменшення при виключенні даних по Брянській області.
1.3. Оцінити статистичну значущість обчислених коефіцієнтів кореляції
Оцінку статистичної значущості коефіцієнтів кореляції будемо проводити за допомогою t-критерію Стьюдента на рівні значущості О± = 0,05.
Парний двухвиборочного t-тест для середніх
r = 0,454
Змінна 1
Змінна 2
Середнє
927,08
258,42
Дисперсія
1101362,746
73524,47289
Спостереження
10
10
Кореляція Пірсона
0,454062283