Введення
Витоками математичної статистики (М.С.) є великий обсяг статистичних даних і потреба після їх спеціальної обробки зробити прогноз розвитку вихідної ситуації.
Перший розділ М.С. - Описова статистика - призначена для збору, представлення в зручному вигляді та опису вихідних даних. Описова статистика обробляє два види даних: кількісні та якісні.
До кількісних відносяться зріст, вага і т.д. до якісних - тип темпераменту, підлогу.
Описова статистика дозволяє описати, узагальнити, звести до бажаного увазі властивості масивів даних.
Другий розділ М.С. - Теорія статистичного висновку - це формалізована система методів розв'язування задач, що зводяться до спроби вивести властивості великого масиву даних шляхом обстеження його малої частини.
Статистичний висновок будується на описової статистики і від приватних властивостей вибірки даних ми переходимо до приватних властивостям сукупності.
Третій розділ М.С. - Планування і аналіз експерта. Розроблена для виявлення та аналізу причинних зв'язків між змінними.
Вимірювання, шкали і статистика
Вимірювання - це приписування чисел об'єктам у відповідності з певними правилами. Числа - це зручні в обробці об'єкти, в які ми перетворимо певні властивості нашого сприйняття.
Шкала найменувань або номінальна шкала. Номінальний вимір зводиться до розбиття сукупності об'єктів на класи в кожному з яких зосереджені об'єкти, ідентичні по якомусь ознакою або властивістю, наприклад, за національністю, по підлозі, по типу темпераменту.
При даних вимірах кожному з класів присвоюється число, але воно використовується виключно як назва цього класу і ніяких операцій над цими числами проводити не передбачається.
Порядкове вимір можливо тільки тоді, коли в кваліфікуються об'єктах можна розрізнити різну ступінь ознаки і властивості, на основі якого проводиться кваліфікація (наприклад, конкурс краси "Розумники і розумниці"). В даному випадку числа використовують тільки одне своє властивість - здатність упорядковуватися.
Інтервальна шкала приймається тоді, коли можна визначити не тільки кількість, властивості або ознаки в об'єкті, але також зафіксувати рівні відмінності між об'єктами, тобто можна ввести одиницю виміру для властивості або ознаки (наприклад, температура , вік).
Числа при інтервальних вимірах мають властивість впорядкованості та однозначності. Рівні різниці чисел відповідають рівним різницям значень вимірюваного властивості або ознаки об'єкта.
Шкала відносин відрізняється від інтервального тільки тим, що точка відліку не довільна, а вказує на повну відсутність вимірюваного властивості або ознаки об'єкта.
Змінні і їх вимір
Змінні бувають дискретні і безперервні. При вимірах, особливо безперервних властивостей або ознак, можна досягти тільки непрямого значення змінної, тобто наближеного до точного і ступінь цього наближення буде визначатися чутливістю вимірювання.
Чутливість визначається мінімальною одиницею цифрової шкали, наявної в нашому розпорядженні.
Межі для точного значення встановлюються шляхом додавання і віднімання половини чутливості вимірювального процесу.
Безліч чисел записується з використанням довільної величини з індексом, який вказує порядковий номер величини в ланцюзі даних (xi).
Позначення S і його властивості
1.
2.
3.
4.
5.
Табулювання і подання даних
Перед аналізом і інтерпретацією даних їх узагальнюють.
Узагальнення - запис даних у вигляді таблиці. Самий елементарний етап.
Ранжування - упорядкування змінних від максимального до мінімального або навпаки. Таке упорядкування називається не GROUP рангом.
Розподіл частот . Проранжувати список згортають, вказуючи всі отримані вимірювання поспіль, одноразово, а в сусідній графі вказують частоту, з якою зустрічається дана оцінка
Розподіл згрупованих частот застосовується при великій кількості оцінок (100 і більше). Оцінки групуються за ознаками і кожна така група називається розрядом оцінок. У разі повного поглинання цими групами всіх даних, ми говоримо про розподіл згрупованих частот.
Побудова розподілу згрупованих частот
Оцінки
Інтервал
Підрахунок
Частота
90 95 51 112
110-114
1
1
66 78 109 62
105-109
111
3
106 70 89 91
100-104
11
2
84 47 58 93
95-99
1111
4
105 95 59 84
90-94
111
3
83100 72
85-89
1
1
104 69 74
80-89
111111
6
82 44 75
75-79
1111
4
97 80 81
70-74
1111
4
97 75 71
65-69
111
3
59 75 68
60-64
1
1
55-59
111
3
50-54
1
1
45-49
1
1
44-45
1
1
Попередньо утворювати не менше 12 і більше 15. Менше 12 спотворює результат, більше 15 утруднює роботу з таблицею.
1) Визначаємо розмах - різницю між максимальною і мінімальною оцінкою (112-44 = 69)
2) Вибір інтервалу розряду: 69:12 = 5,75
Визначаємо зі зменшенням до 5: 69:15 = 4,6
3) Визначення меж розділу. Необхідно утворити достатню кількість розрядів, щоб не втратити найменшу і найбільшу оцінки, тому табулювання почнемо з величини кратної інтервалу. Найближчим кратне 5 нижче нижньої оцінки - це 40. І ділимо на розряди до тих пір, поки не буде охоплена найвища оцінка. Якщо необхідно порівняти 2 і більше вибірки, їх поміщають в таку ж таблицю.
Квантилі
Квант - це спосіб описати групу вимірювань. Квантиль - це загальне поняття.
Квантиль - точка на числовій шкалі, яка ділить сукупність спостережень на групи з відповідними пропорціями в кожній з них.
Квартиль - ділить спостереження на 4 групи ( Q )
деціль - ділить спостереження на 10 груп ( D )
квінтеля - ділить спостереження на 5 груп ( К )
Процентиль - ділить спостереження на 100 груп ( Р )
Визначення процентелей
Процентель являє собою точку, нижче якої лежить Р% - в оцінок.
Обчислення процентеля
Оцінка
38
37
36
35
34
33
32
31
30
28
29
27
26
25
24
Частота
1
1
3
5
9
8
17
23
24
18
10
3
1
0
2
Накопичена частота
125
124
123
120
115
106
98
81
58
16
34
6
3
2
Для визначення 25 процентиль P2...