Федеральне агентство з утворення
Державне освітня установа вищої професійної освіти
В«Санкт-Петербурзький державний політехнічний університет В»
Факультет економіки та менеджменту
Кафедра В«Підприємництво і комерція В»
ЛАБОРАТОРНА РОБОТА № 1
З дисципліни В«СтатистикаВ»
На тему В«Аналіз емпіричного розподілу В»
Санкт-Петербург 2008
Введення
Ряд розподілу - це розподіл одиниць сукупності за значенням тієї чи іншої ознаки. Комплексний аналіз ряду розподілу включає:
Табличне і графічне представлення ряду розподілу; Розрахунок і аналіз показників центру і структури розподілу; Розрахунок і аналіз показників варіації; Характеристику форми розподілу; Вибір теоретичного розподілу, якому відповідає досліджуване емпіричне [1].
Ряди розподілу можуть бути:
1) Варіаційними;
2) Атрибутивними.
Одна з найважливіших цілей вивчення рядів розподілу полягає в тому, щоб виявити закономірність розподілу і визначити її характер. Закономірності розподілу найбільш виразно проявляються тільки при великій кількості спостережень (т.зв. закон великих чисел).
Вихідними даними для аналізу служить інформація, отримана із збірки Росстату Регіони Росії [2], а саме статистична інформація про числі власних легкових автомобілів на 1000 чоловік населення в різних регіонах Росії в 1990 році. Обсяг вихідної сукупності - 87 одиниць.
1. Табличне і графічне представлення варіаційного ряду
Аналіз розподілів спрямований на виявлення закономірності зміни частот в залежності від значень варьирующего ознаки і аналіз різних характеристик досліджуваного розподілу. Перш, ніж приступити до обчислення спеціальних статистичних показників, необхідно з вихідної сукупності виключити одиниці, що не підкоряються загальної закономірності розподілу, так звані викиди. Викиди - це значення ознаки, різко відрізняються як у більшу, так і в меншу сторону, від значень ознаки основної частини одиниць сукупності [3].
Для локалізації і усунення викидів необхідно, перш за все, ранжувати вихідні дані. Потім, в ППП Statistica будується графік Box plot на підставі ранжированого сукупності. Одиниці сукупності, позначені на графіку зірочками (*), є викидами, які необхідно виключити з досліджуваної сукупності.
варіаційним називається ряд розподілу, побудований за кількісною ознакою. Він може бути представлений у вигляді таблиці та графічно. Табличне представлення дозволяє не тільки виявити ту чи іншу закономірність розподілу, але й докладно охарактеризувати структуру досліджуваної сукупності.
Таблиці варіаційних рядів будуються за принципами угруповання. Відомі проблеми виникають при визначенні числа груп, оскільки формула Стерджеса (1.1), рекомендована для цих цілей, дає прийнятні результати тільки в умовах великих статистичних сукупностей. Процес визначення числа виділених груп, в значній мірі, носить творчий характер і вимагає від дослідника застосування не тільки теоретичних знань, але і практичного досвіду та інтуїції.
Формула Стерджеса:
, (1.1)
де k - число груп; N - обсяг сукупності.
Використання ППП значно спрощує завдання табличного представлення варіаційного ряду, оскільки дозволяє з малими тимчасовими витратами переглянути кілька таблиць з різним числом груп і розміром группировочного інтервалу. Кінцевий варіант таблиці повинен відповідати наступним вимогам: у таблиці не повинно бути Малонаповненні і нульових груп; потрібно прагнути до отримання мономодальні розподілу (тобто по обидві сторони від максимальної частоти повинно спостерігатися закономірне спадання частот). Якщо не вдається позбутися від многовершінний в розподілі, це, як правило, означає, що досліджувана статистична сукупність неоднорідна і вимагає більш детального вивчення. У цих умовах слід або працювати з викидами, або, якщо одиниці сукупності не підкоряються єдиній закономірності розподілу, розбити сукупність на об'єктивно існуючі групи, і аналізувати їх окремо [3].
Далі представлені таблиці варіаційного ряду, побудовані з використанням різної кількості інтервалів.
Таблиця 1.1. Розподіл регіонів Росії за кількістю власних легкових автомобілів на 1000 чоловік населення у 1990 році. k = 8
Таблиця 1.2. Розподіл регіонів Росії за кількістю власних легкових автомобілів на 1000 чоловік населення у 1990 році. k = 6
При k = 8 отримано багато Малонаповненні груп, що є небажаним для аналізу ряду розподілу. Вибираючи остаточний варіант табличного представлення варіаційного ряду в роботі, слід зупинитися на угрупованні з використанням 6 груп. Тоді величина группировочного інтервалу становитиме 14,6.
Необхідно підвести попередні підсумки (на прикладі третього рядка): тільки в тридцяти регіонах Росії, що становить 35,71% від загального числа регіонів, кількість автомобілів на 1000 чоловік населення в 1990 році становила від 46,3 до 60,9 штук. У п'ятдесяти п'яти регіонах Росії (65,47% від усіх регіонів) кількість автомобілів на 1000 чоловік населення в 1990 році становила менше 60,9 штук.
Табличне представлення варіаційного ряду дозволяє отримати детальну інформацію про склад і структуру досліджуваної сукупності, тобто визначити яку кількість одиниць досліджуваної сукупності володіє тим чи іншим значенням ознаки і яка частка цієї групи одиниць в загальному обсязі сукупності, а також виявити закономірність зміни частот.
На основі таблиць будуються графіки, наочно представляють закономірність розподілу аналізованої статистичної сукупності. Графічне представлення може бути здійснено як використанням абсолютних, так і відносних частот [3].
Рис. 1.1. Полігон розподілу регіонів Росії за кількістю власних легкових автомобілів на 1000 чоловік населення у 1990 році
Рис. 1.2. Кумулята розподілу регіонів Росії за кількістю власних легкових автомобілів на 1000 чоловік населення у 1990 році
Рис. 1.3 Гістограма розподілу регіонів Росії за кількістю власних легкових автомобілів на 1000 чоловік населення у 1990 році
2. Характеристика центральної тенденції розподілу
Середнє значення ознак сукупності, мода і медіана характеризують центральну тенденцію розподілу, вказують той рівень ознаки, який є типовим, характерним для даної сукупності. Використання того чи іншого показника розподілу залежить від типу вихідних даних і мети дослідження. Оскільки середня величина розраховується на одиницю сукупності, але з використанням всіх індивідуальних значень ознаки, вона є узагальненою характеристикою всієї сукупності [1].
Формули розрахунку. Середня арифметична проста:
,
де - значення ознаки в i-ой одиниці сукупності, n - обсяг сукупності.
Медіана:
,
де - нижня межа медіанного інтервалу, - величина группировочного інтервалу, - сума частот (), - накопичена частота інтервалу, попереднього медианному; - частота медіанного інтервалу.
Мода:
,
де - нижня межа модального інтервалу, - величина группировочного інтервалу, - частота модального інтервалу,
/- частота інтервалу, що передує/наступного за модальним.
Таблиця 2.1. Показники центру і структури розподілу
Показник центру
Значення
Середнє значення
55,70595
Медіана
56,15000
Мода
52,87000
У середньому в регіонах Росії кількість автомобілів на 1000 чоловік населення у 1990 році становило 55,71 штуку. У 50% р...