Статистика навчання, від презентації до заходів розподілу даних

Статистика - це математична наука, яка вивчає збір, обробку, аналіз та представлення даних. Статистика широко використовується в страхових компаніях, одна з яких - визначення розміру премії в страховому полісі. Кожен страхувальник повинен сплатити внесок, який називається премією. Виплачена премія відповідає страховому покриттю, яке він отримує.

Тут страхова компанія використовує статистику, щоб розмір премії відповідав розміру покриття, яке може бути надане страхувальнику. Таким чином виграють від цього обидві сторони.

Як вже згадувалося раніше, статистика не тільки збирає та обробляє, але й представляє дані. Статистика також використовує кілька заходів розподілу даних при обробці даних. Сьогодні ми обговоримо типи подання, а також розмір розповсюдження даних у статистиці.

Типи подання даних

Типи подання даних у статистиці включають таблиці розподілу частот, гістограми, багатокутники та огиви.

Перша форма подання даних - використання таблиці розподілу частот. Як випливає з назви, ми використовуємо таблицю для відображення типу та обсягу отриманих даних. Таблиця розподілу частот також має кілька типів, а саме таблицю розподілу частоти для окремих даних та даних групи.

(Також читайте: Два вимірювальні дані у статистиці)

Одна таблиця розподілу частоти даних використовується для подання невеликих обсягів даних, щонайменше менше 30 даних. Приклад подання даних за допомогою єдиної таблиці розподілу частоти даних є наступним.

Дані нижче - тестові результати 30 студентів. Подавати в єдину таблицю розподілу частоти даних!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Якщо ми звернемо увагу, найнижчий бал тесту - 3, тоді як найвищий - 10. Тоді з цих балів підраховується кількість студентів, які його отримали. Для оцінки 3, наприклад, лише 1 студент. Для 4 класу навчається 4 учні тощо. Потім ця цифра представлена ​​в таблиці, як показано нижче.

турбіни на землі офшорних вітряних електростанцій

Наступним типом таблиці розподілу частоти є таблиця розподілу частоти даних групи. Ця таблиця використовується для подання великої кількості даних, тобто понад 30 даних. Давайте розглянемо приклад нижче.

Далі наводиться висота рослин чилі (у міліметрах) на плантації чилі. Подайте дані до групової таблиці розподілу даних!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

На відміну від окремих даних, тут ми повинні розрахувати кількість класів та довжини класів, які будуть відображені в таблиці. Використовуючи наведені вище дані, ось розрахунки.

Багато даних (n) = 40

Максимальна висота (xмакс) = 135

Мінімальна висота (xхв) = 120

Діапазон (J) = xмакс - ххв = 135 – 120 = 15

Кількість класів (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Довжина класу (c) = J / k = 15/6 = 2,5 ≈ c = 3

З цих результатів ми можемо відобразити таблицю розподілу групових даних наступним чином.

турбіни на землі офшорних вітряних електростанцій

Далі ми обговоримо інші типи згрупованого подання даних, а саме у вигляді гістограм, полігонів частоти та оґів. Погляньте на таблицю частот нижче, яка містить інформацію про вагу для 80 членів спортивного клубу.

турбіни на землі офшорних вітряних електростанцій

Для подання даних за допомогою графіку гістограм спочатку будуємо декартову діаграму. Вісь x показує верхню та нижню межі кожного класу, тоді як вісь y показує частоту.

статистика4 (1)

На відміну від гістограми, графік багатокутника частоти приймає середнє значення інтервалу класу і відображає його рядками відповідно до частоти.

статистика5 (1)

Нарешті, для подання даних використовується позитивна кумулятивна або негативна крива частоти. Спочатку позначте кумулятивні значення частоти кожного класу інтервалів на осі y. Потім позначте координати точок відповідно до пар верхніх меж класу інтервалів та кумулятивної частоти. З’єднайте точки в плавну криву.

Розмір розповсюдження даних

У статистиці існує два типи вимірювання даних, а саме розмір концентрації даних та розмір розподілу даних. У чому пояснення та різниця?

Розмір центру обробки даних - це значення, яке відображає розташування даних. У вимірі, орієнтованому на дані, є середнє значення, режим і медіана.

Середнє або середнє - це частковий коефіцієнт між сумою всіх спостережуваних даних із великою кількістю даних. Середнє значення можна сформулювати наступним чином.

Середнє = (Сума всіх даних) / (Багато даних)

Щоб краще зрозуміти, давайте попрацюємо над наступним прикладом проблеми. Кількість годин на тиждень, необхідних 5 людям для соціальних дій в їх оточенні, становить 10, 7, 13, 20 і 15 годин. Визначте середню кількість годин на тиждень, яку вони витрачають на соціальну діяльність!

Виходячи з наведених вище проблем, ми можемо ввести числа у формулу наступним чином.

Середнє = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Це означає, що середня кількість годин, яку вони витрачають на соціальну діяльність, становить 13 годин.

Крім середнього або середнього, існують також режими. Режим - це значення, яке найчастіше відображається в даних. Давайте розглянемо приклад наступної проблеми.

Нижче наведені дані про вагу (у кілограмах) деяких учнів 7 класу. Визначте режим даних!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Перш за все, ми повинні підрахувати, скільки разів кожне значення відображається в даних. На основі цих даних ми отримуємо 31 (x3), 32 (x2), 33 (x1), 34 (x2) та 35 (x4). Оскільки 35 зустрічається найчастіше, режим даних, наведених вище, становить 35.

Останній тип орієнтованого на дані показника - це медіана. Медіана ділить дані на дві рівні частини, так що медіана є середнім значенням відсортованих даних.

Щоб визначити медіану, ми повинні спочатку відсортувати всі дані за спаданням або зростанням. По-друге, визначте багато даних і символізуйте їх як "n". Якщо n непарна, формула, яку ми використовуємо, така.

Медіана = номер даних - ((n + 1) / 2)

Тим часом, якщо n парне, ми будемо використовувати формулу нижче.

Медіана = (дані i (n / 2) + дані i (n / 2 + 1)) / 2

Друге вимірювання даних у статистиці - це показник поширення даних. Розмір розповсюдження даних - це значення, яке визначає відстань даних від центру обробки даних. Розмір розподілу даних складається з діапазону, квартильного та міжквартильного діапазону.

Діапазон - це різниця між найбільшим значенням даних та найменшим значенням даних. Ми можемо отримати охоплення, віднявши найбільші дані з найменших даних. Наприклад, якщо в одному класі найвищий учень має зріст 160 см, а найнижчий учень - 143 см, ми отримаємо діапазон 23 см.

Тим часом квартиль - це групування статистичних даних на чотири рівні частини. Розмір квартиля ділиться на 3, а саме нижній квартиль (Q1), середній квартиль (Q2 або медіана), і верхній квартиль (Q3). Щоб визначити кожен квартиль, ми повинні зробити кілька кроків.

Спочатку сортуйте дані за зростанням або за спаданням. По-друге, визначте середнє або середнє значення даних. По-третє, знайдіть нижній квартиль (Q1), що є середнім значенням групи даних нижче медіани (Q2). Нарешті, знайдіть верхній квартиль (Q3), а саме середнє значення групи даних вище медіани (Q2).

Останній тип міри розподілу даних - це міжквартильний діапазон. Міжквартильний діапазон - це різниця між верхніми та нижніми квартилями. Формула така.

Питанняd = Q3 - Q1

Останні повідомлення

$config[zx-auto] not found$config[zx-overlay] not found