Пояснення, застосування та приклади
The Управляє кров є критерієм, що використовується для визначення кількості класів або інтервалів, які необхідні для графічного представлення набору статистичних даних. Це правило було проголошено в 1926 році німецьким математиком Гербертом Стургесом.
Sturges запропонував простий метод, заснований на кількості вибірок x, що дозволило знайти кількість класів і їх амплітуду діапазону. Правило Sturges широко використовується, особливо в області статистики, зокрема для побудови частотних гістограм.
Індекс
- 1 Пояснення
- 2 Програми
- 3 Приклад
- 4 Посилання
Пояснення
Правило Sturges - це емпіричний метод, який широко використовується в описовій статистиці для визначення кількості класів, які повинні існувати в частотній гістограмі, для класифікації набору даних, що представляють зразок або популяцію.
В основному це правило визначає ширину графічних контейнерів, частотні гістограми.
Для встановлення свого правила Герберт Стургес розглядав ідеальну частотну діаграму, яка складається з K інтервалів, де i-й інтервал містить певну кількість вибірок (i = 0, ... k - 1), представлених у вигляді:
Ця кількість вибірок задається кількістю способів, якими може бути вилучено підмножина множини; тобто за біноміальним коефіцієнтом, виражене таким чином:
Щоб спростити вираз, він застосував властивості логарифмів в обох частинах рівняння:
Таким чином, Sturges встановив, що оптимальне число інтервалів k задається виразом:
Вона також може бути виражена як:
У цьому виразі:
- k - кількість класів.
- N - загальна кількість спостережень за зразком.
- Лог - загальний логарифм бази 10.
Наприклад, щоб зробити частотну гістограму, яка виражає випадкову вибірку висоти 142 дітей, кількість інтервалів або класів, які будуть мати розподіл:
k = 1 + 3,322 * журнал10 (N)
k = 1 + 3,322* журнал (142)
k = 1 + 3,322* 2,1523
k = 8,14 ≈ 8
Таким чином, розподіл буде відбуватися в 8 інтервалах.
Кількість інтервалів завжди повинна бути представлена цілими числами. У випадках, коли значення є десятковим, необхідно зробити наближення до найближчого цілого числа.
Програми
Правило Sturges застосовується в основному в статистиці, оскільки дозволяє здійснювати розподіл частот через обчислення кількості класів (k), а також довжини кожного з них, також відомого як амплітуда.
Амплітуда - це різниця між верхньою і нижньою межами класу, розділена на кількість класів, і виражається:
Існує багато емпіричних правил, які дозволяють здійснювати розподіл частот. Однак правило Sturges зазвичай використовується, оскільки воно наближається до кількості класів, які зазвичай коливаються від 5 до 15.
Таким чином, розглянемо значення, яке адекватно представляє зразок або популяцію; тобто, апроксимація не представляє крайніх угруповань, і вона не працює з надмірною кількістю класів, які не дозволяють узагальнювати зразок.
Приклад
Необхідно виконати частотну гістограму за даними даними, відповідно до віку, отриманого при обстеженні чоловіків, які роблять вправи в місцевому тренажерному залі..
Для визначення інтервалів необхідно знати, який розмір вибірки або кількість спостережень; у цьому випадку у вас є 30.
Тоді застосовується правило Sturges:
k = 1 + 3,322 * журнал10 (N)
k = 1 + 3,322* журнал (30)
k = 1 + 3,322* 1,4771
k = 5,90 ≈ 6 інтервалів.
З числа інтервалів можна розрахувати амплітуду, яку вони матимуть; тобто ширина кожного рядка, представленого на частотній гістограмі:
Нижня межа вважається найнижчим значенням даних, а верхня межа - найвищим значенням. Різниця між верхньою і нижньою межею називається діапазоном або контуром змінної (R).
З таблиці ми маємо, що верхня межа дорівнює 46 і нижня межа 13; таким чином, амплітуда кожного класу буде:
Інтервали будуть складатися з верхньої та нижньої межі. Щоб визначити ці інтервали, почніть відлік від нижньої межі, додавши до неї амплітуду, визначену правилом (6), наступним чином:
Потім обчислюється абсолютна частота для визначення кількості чоловіків, відповідних кожному інтервалу; у цьому випадку це:
- Інтервал 1: 13 - 18 = 9
- Інтервал 2: 19 - 24 = 9
- Інтервал 3: 25 - 30 = 5
- Інтервал 4: 31 - 36 = 2
- Інтервал 5: 37 - 42 = 2
- Інтервал 6: 43 - 48 = 3
При додаванні абсолютної частоти кожного класу, вона повинна дорівнювати загальній кількості вибірки; в даному випадку 30.
Згодом обчислюється відносна частота кожного інтервалу, розділяючи абсолютну частоту цього інтервалу на загальну кількість спостережень:
- Інтервал 1: fi = 9 = 30 = 0.30
- Інтервал 2: fi = 9 = 30 = 0.30
- Інтервал 3: fi = 5 = 30 = 0,1666
- Інтервал 4: fi = 2 = 30 = 0,0666
- Інтервал 5: fi = 2 = 30 = 0,0666
- Інтервал 4: fi = 3 = 30 = 0,10
Потім можна скласти таблицю, яка відображає дані, а також діаграму від відносної частоти по відношенню до отриманих інтервалів, як це видно з наступних зображень: \ t
Таким чином, правило Sturges дозволяє визначити кількість класів або інтервалів, в яких можна розділити вибірки, щоб узагальнити вибірку даних за допомогою підготовки таблиць і графіків..
Список літератури
- Alfonso Urquía, М. V. (2013). Моделювання та моделювання дискретних подій. UNED,.
- Альтман Наомі, М. К. (2015). "Проста лінійна регресія". Методи природи .
- Antúnez, R. J. (2014). Статистика в освіті. Цифровий UNID.
- Fox, J. (1997). Прикладний регресійний аналіз, лінійні моделі та пов'язані методи. Публікації SAGE.
- Умберто Ллінас Солано, С. Р. (2005). Описова статистика і розподіли ймовірностей. Університет Півночі.
- Пантелеева О. В. (2005). Основи ймовірностей і статистика.
- O. Kuehl, M. O. (2001). Дизайн експериментів: статистичні принципи проектування та дослідження. Редактори Thomson.