Введення
У практичних спостереженнях ми зазвичай маємо сукупність спостережень х1, х2, ... , Хn, на основі яких потрібно зробити ті чи інші висновки. Часто цих спостережень багато, тому виникає завдання їх компактного опису. В ідеалі таким описом могло б бути твердження, що х1, х2, ... , Хn є вибіркою, тобто незалежними реалізаціями випадкової величини x з відомим законом розподілу F (x). Це дозволило б теоретично провести розрахунки всіх необхідних досліднику характеристик спостережуваного явища.
Однак далеко не завжди ми можемо стверджувати, що х1, х2, ... , Хn є незалежними і однаково розподіленими випадковими величинами. По-перше, це необхідно перевірити, а по-друге, часто свідомо відомо, що це не так. Тому для компактного опису сукупності спостережень використовують інші методи - методи описової статистики.
1. Методи описової статистики
Методами описової статистики називаються методи опису вибірок х1, х2, ... , Хn за допомогою різних показників та графіків. Гідність методів описової статистики у тому, що її прості і досить інформативні статистичні показники позбавляють від необхідності перегляду великої кількості значень вибірки.
1 Показники описової статистики
Показники, що описують вибірку можна розбити на кілька груп:
1. Показники стану описують положення даних (або середини сукупності) на числової осі:
- Мінімальний і максимальний елементи вибірки
- Вибіркові верхній і нижній квартили
- Середнє
- Вибіркова медіана
- Вибіркова мода
2. Показники розкиду описують ступінь розкиду даних щодо свого центру (Наскільки купчасто основна маса даних групується біля середини сукупності)
- Дисперсія вибірки
- Вибіркове середнє квадратичне відхилення (стандартне відхилення)
- Розмах
- Коефіцієнт ексцесу
3. Показники асиметрії описують симетричність розподілу даних близько свого центру
- Коефіцієнт асиметрії
- Положення вибіркової медіани щодо вибіркового середнього і щодо вибіркових квартилей
- Гістограма
4. Показники, що описують закон розподілу , дають уявлення про законі розподілу даних
- Гістограма
- Вибіркова функція розподілу
- Таблиця частот
З перерахованих вище характеристик на практиці за традицією частіше всього використовують вибіркові середнє, медіану і дисперсію (або стандартне відхилення). Однак для отримання більш точних і достовірних висновків необхідно використовувати й інші показники.
Особливу увагу слід звернути на наявність у вибірці викидів - Грубих, сильно відрізняються від основної маси, спостережень. Більшість традиційних статистичних методів вельми чутливі до відхилень від умов застосовності методу. Тому викиди можуть не тільки спотворити значення вибіркових показників, але і привести до помилкових висновків. Підозра про присутність таких спостережень повинно виникнути, якщо вибіркова медіана сильно відрізняється від вибіркового середнього, хоча в цілому сукупність симетрична, або, якщо положення медіани сильно несиметрично щодо мінімального і максимального елементів вибірки. Найпростіше виявити викиди за допомогою переходу від вибірки до варіаційного ряду або гістограмі з великим числом інтервалів угруповання.
2 Порядок виконання роботи
2.1 Вихідні дані
Вихідними даними є набір реалізацій випадкової величини (Наприклад, значення якої-небудь величини, отримані при вимірі). Розмір вибірки - n шт. Вихідні дані оформити у вигляді таблиці (таблиця 1).
Таблиця 1 - Вихідні дані
Номер реалізації
Значення
Номер реалізації
Значення
Номер реалізації
Значення
Номер реалізації
Значення
1 ...
... n
2. 2 Побудова варіаційного ряду
Для зручності роботи з даними вибірку перетворять в варіаційний ряд - ряд, в якому елементи вибірки упорядковуються за зростанням.
Етапи виконання:
1. Знайти найменший елемент ряду Xmin
2. Знайти найбільший елемент ряду Xmax
3. Записати ряд, починаючи з найменшого елемента Xmin і закінчуючи найбільшим Xmax (таблиця 2)
4. Для спрощення процедури обробки та з метою зменшення помилок при обчисленнях необхідно відняти з кожного елемента ряду постійне число (Наприклад, округлене Xmin) і використовувати в розрахунках не самі розміри, а їх відхиленнями. Утворені відхилення записати в таблицю 2.
Таблиця 2 - Варіаційний ряд з відхиленнями щодо x0 = <значення> [1]
Номер елемента
Елемент
Відхилення
Номер елемента
Елемент
Відхилення
1 ...
n
2.3 Групування даних
Етапи виконання:
1. Розбити весь діапазон R = Xmax - Xmin на r інтервалів. Число інтервалів r встановлюють залежно від числа спостережень n:
n
r
40-100
100-500
5000-10000
7-9
8-12
10-16
При невеликих вибірках.
2. Призначити довжину інтервалів. Довжину інтервалів Dx найчастіше вибирають однаковою: Dx = R/r. Її округлюють до значення, зручного для графічного відображення.
3. Призначити нижню межу xн першого інтервалу (у відхиленнях від x0). Вона повинна бути менше xmin і зручною з позиції графічного відображення. Результат занести в таблицю 3.
4. Призначити нижні xн і верхні Xв кордону всіх залишилися інтервалів (у відхиленнях від x0). Результати занести в таблицю 3.
5. Визначити число розмірів, що потрапляють в інтервал mi. Умова попадання розміру xj в інтервал xiн
2.4 Визначення частостей
Ставлення частоти mi до загальної кількості спостережень n називається частості :
частості являє собою емпіричну оцінку ймовірності попадання результатів спостережень Хj в i інтервал.
Визначити частості і результати занести в таблицю 3.
Отримані результати перевірити за умовою.
2.5 Визначення емпіричної щільності ймовірностей
Емпірична щільність ймовірностей дорівнює:
Визначити емпіричну щільність ймовірності, результати занести в таблицю 3.
Таблиця 3 - Розрахункові дані
Номери інтервалів
Межі інтервалів, <розмірність>
|