АНАЛІЗ РЯДІВ РОЗПОДІЛУ
Зміст
Введення
1. Характеристики центру розподілу
1.1 Мода
1.2 Медіана
1.3 Показники диференціації
2. Характеристики варіації
2.1 Абсолютні характеристики варіації
2.1.1 Розрахунок дисперсії способом моментів
2.1.2 Розрахунок дисперсії альтернативного ознаки
2.1.3 міжгрупових дисперсія. Правило додавання дисперсій
2.2 Відносні характеристики варіації
3. Теоретичні криві розподілу
3.1 Нормальний розподіл
3.2 Вирівнювання емпіричного розподілу по кривій нормального розподілу
3.3 Критерії згоди
3.4 Характеристики нерівномірності розподілу
Введення
Ряд розподілу (тобто впорядковане розподіл одиниць досліджуваної сукупності на групи за певною варьирующему ознакою) характеризує склад, структуру сукупності за певною ознакою. Його будують для того, щоб виявити характер розподілу одиниць сукупності по варьирующему ознакою, визначити закономірності в цьому розподілі.
Для аналізу ряду розподілу використовують ряд статистичних характеристик:
частотні характеристики;
характеристики центру розподілу;
характеристики варіації;
характеристики нерівномірності розподілу.
Частотні характеристики ряду розподілу, а саме, частоти і частості (або інша назва - частка ), Накопичені (або кумулятивні) частоти і частості, абсолютна і відносна щільність розподілу, були розглянуті в темі "Зведення і групування статистичних даних".
1. Характеристики центру розподілу
До характеристик центру розподілу відносять середню, моду і медіану. Ці характеристики прийнято також називати структурними середніми, вони визначають вид полігону та гістограми, емпіричного закону розподілу .
В якості середньої для характеристики центру розподілу найчастіше використовують середню арифметичну просту або зважену.
1.1 Мода
Мода (Мо) - це варіанта, яка найчастіше зустрічається в досліджуваній сукупності. Мода не залежить від крайніх значень варіант і може застосовується для характеристики центру в рядах розподілу з невизначеними межами.
У дискретному варіаційному ряду мода визначається візуально і дорівнює варіанті з найбільшою частотою або частості. Дані розподілу робочих за стажем роботи (див. лекцію "Зведення і групування статистичних даних ") показують, що найбільше робочих мають стаж роботи 4 роки, тобто варіанту, що дорівнює 4, є модою ознаки. Мо = 4.
В інтервальних рядах розподілу для знаходження моди спочатку по найбільшої частоті визначають модальний інтервал, тобто інтервал, що містить моду, а потім приблизно розраховують її за формулою:
,
де - нижня межа модального інтервалу;
- величина модального інтервалу;
- частоти відповідно в попередньому і наступним за модальним інтервалах.
Зустрічаються ряди, які мають два моди (бімодальний ряд) або кілька (полімодальний).
Розрахуємо моду інтервального ряду розподілу робітників за розміром заробітної плати (див. лекцію "Зведення і групування статистичних даних ").
У цьому варіаційному ряду інтервал 900-1000 грн., в який потрапило максимальну кількість робочих (9 чол), є модальним.
грн.
Отримане значення моди свідчить про те, що в розглянутій сукупності найбільш типовою є заробітна плата 914,29 грн., що вище раніше розрахованої середньої зарплати (870 грн).
Для ряду з нерівними інтервалами модальний інтервал визначається по найбільшій щільності розподілу, а в розрахунковій формулі моди замість частот використовують абсолютні щільності розподілу.
Для інтервальних варіаційних рядів з рівними інтервалами моду можна наближено визначити графічно.
Для цього на гістограмі цього ряду (див. гістограму в лекції "Зведення і групування статистичних даних") вибирають найвищий прямокутник, який і є модальним.
Далі праву верхню вершину прямокутника, що передує модальному (частота f mо-1 ), з'єднують з правої верхньої вершиною модального прямокутника (частота f mо ), а ліву верхню вершину цього прямокутника - з лівої верхньої вершиною прямокутника, наступного за модальним (частота f mо +1 ).
З точки перетину опускають перпендикуляр на горизонтальну вісь. Підстава перпендикуляра покаже значення моди Мо. Точність визначення залежить від масштабу графіка.
1.2 Медіана
Медианой Ме називають таке значення ознаки, яке припадає на середину рангового ряду і ділить його на дві рівні по числу одиниць частини. Таким чином, в ранжируваному ряду розподілу одна половина ряду має значення ознаки, що перевищують медіану, інша - менше медіани. Медіану використовують замість середньої арифметичної, коли крайні варіанти ранжированного ряду (найменша і найбільша) по порівнянні з іншими виявляються надмірно великими або надмірно малими.
У дискретному варіаційному ряду, містить непарне число одиниць, медіана дорівнює варіанті ознаки, що має номер
:
,
де N - число одиниць сукупності.
У дискретному ряду, що складається з парного числа одиниць сукупності, медіана визначається як середня з варіант, що мають номери
і :.
У розподілі робітників по стажу роботи медіана дорівнює середній з варіант, що мають у ранжируваному ряду номера 10: 2 = 5 і 10: 2 + 1 = 6. Варіанти п'ятого і шостого ознаки рівні 4 років, таким чином
року
При обчисленні медіани в інтервальному ряду спочатку знаходять медіанний інтервал, (тобто містить медіану), для чого використовують накопичені частоти або частості. Медіанним є інтервал, накопичена частота якого дорівнює або перевищує половину всього обсягу сукупності. Потім значення медіани розраховується за формулою:
,
де - нижня межа медіанного інтервалу; - ширина медіанного інтервалу; - накопичена частота інтервалу, що передує медианному; - частота медіанного інтервалу.
Розрахуємо медіану ряду розподілу робочих за розміром зарплати (див. лекцію "Зведення і групування статистичних даних ").
медіа є інтервал заробітної плати 800-900 грн., оскільки його кумулятивна частота дорівнює 17, що перевищує половину суми всіх частот (). Тоді
Ме = 800 +100 грн.
Отримане значення говорить про тому, половина робітників мають заробітну плату нижче 875 грн., але це вище середнього її розміру.
Для визначення медіани можна замість кумулятивних частот використовувати кумулятивні частості.
Медіана, як і мода, не залежить від крайніх значень варіант, тому також застосовується для характеристики центру в рядах розподілу з невизначеними межами.
Властивість медіани : сума абсолютних величин відхилень варіант від медіани менше, ніж від будь-якої іншої величини (в тому числі і від середньої арифметичної):
Це властивість медіани використовується на транспорті при проектуванні розташування трамвайних та тролейбусних зупинок, бензоколонок, складальних пунктів і т. д.
Приклад. На шосе довжиною 100 км розташовано 10 гаражів. Для проектування будівництва бензоколонки були зібрані дані про число передбачуваних їздець на заправку по кожному гаражу.
Таблиця 2 - Дані про кількість їздець на заправку по кожному гаражу.
Кілометр шосе, на якому розташований гараж
7
26
28
37
40
46
60
|