Пояснення, застосування та приклади



The Управляє кров є критерієм, що використовується для визначення кількості класів або інтервалів, які необхідні для графічного представлення набору статистичних даних. Це правило було проголошено в 1926 році німецьким математиком Гербертом Стургесом.

Sturges запропонував простий метод, заснований на кількості вибірок x, що дозволило знайти кількість класів і їх амплітуду діапазону. Правило Sturges широко використовується, особливо в області статистики, зокрема для побудови частотних гістограм.

Індекс

  • 1 Пояснення
  • 2 Програми
  • 3 Приклад
  • 4 Посилання

Пояснення

Правило Sturges - це емпіричний метод, який широко використовується в описовій статистиці для визначення кількості класів, які повинні існувати в частотній гістограмі, для класифікації набору даних, що представляють зразок або популяцію.

В основному це правило визначає ширину графічних контейнерів, частотні гістограми.

Для встановлення свого правила Герберт Стургес розглядав ідеальну частотну діаграму, яка складається з K інтервалів, де i-й інтервал містить певну кількість вибірок (i = 0, ... k - 1), представлених у вигляді:

Ця кількість вибірок задається кількістю способів, якими може бути вилучено підмножина множини; тобто за біноміальним коефіцієнтом, виражене таким чином:

Щоб спростити вираз, він застосував властивості логарифмів в обох частинах рівняння:

Таким чином, Sturges встановив, що оптимальне число інтервалів k задається виразом:

Вона також може бути виражена як:

У цьому виразі:

- k - кількість класів.

- N - загальна кількість спостережень за зразком.

- Лог - загальний логарифм бази 10.

Наприклад, щоб зробити частотну гістограму, яка виражає випадкову вибірку висоти 142 дітей, кількість інтервалів або класів, які будуть мати розподіл:

k = 1 + 3,322 * журнал10 (N)

k = 1 + 3,322* журнал (142)

k = 1 + 3,322* 2,1523

k = 8,14 ≈ 8

Таким чином, розподіл буде відбуватися в 8 інтервалах.

Кількість інтервалів завжди повинна бути представлена ​​цілими числами. У випадках, коли значення є десятковим, необхідно зробити наближення до найближчого цілого числа.

Програми

Правило Sturges застосовується в основному в статистиці, оскільки дозволяє здійснювати розподіл частот через обчислення кількості класів (k), а також довжини кожного з них, також відомого як амплітуда.

Амплітуда - це різниця між верхньою і нижньою межами класу, розділена на кількість класів, і виражається:

Існує багато емпіричних правил, які дозволяють здійснювати розподіл частот. Однак правило Sturges зазвичай використовується, оскільки воно наближається до кількості класів, які зазвичай коливаються від 5 до 15.

Таким чином, розглянемо значення, яке адекватно представляє зразок або популяцію; тобто, апроксимація не представляє крайніх угруповань, і вона не працює з надмірною кількістю класів, які не дозволяють узагальнювати зразок.

Приклад

Необхідно виконати частотну гістограму за даними даними, відповідно до віку, отриманого при обстеженні чоловіків, які роблять вправи в місцевому тренажерному залі..

Для визначення інтервалів необхідно знати, який розмір вибірки або кількість спостережень; у цьому випадку у вас є 30.

Тоді застосовується правило Sturges:

k = 1 + 3,322 * журнал10 (N)

k = 1 + 3,322* журнал (30)

k = 1 + 3,322* 1,4771

k = 5,90 ≈ 6 інтервалів.

З числа інтервалів можна розрахувати амплітуду, яку вони матимуть; тобто ширина кожного рядка, представленого на частотній гістограмі:

Нижня межа вважається найнижчим значенням даних, а верхня межа - найвищим значенням. Різниця між верхньою і нижньою межею називається діапазоном або контуром змінної (R).

З таблиці ми маємо, що верхня межа дорівнює 46 і нижня межа 13; таким чином, амплітуда кожного класу буде:

Інтервали будуть складатися з верхньої та нижньої межі. Щоб визначити ці інтервали, почніть відлік від нижньої межі, додавши до неї амплітуду, визначену правилом (6), наступним чином:

Потім обчислюється абсолютна частота для визначення кількості чоловіків, відповідних кожному інтервалу; у цьому випадку це:

- Інтервал 1: 13 - 18 = 9

- Інтервал 2: 19 - 24 = 9

- Інтервал 3: 25 - 30 = 5

- Інтервал 4: 31 - 36 = 2

- Інтервал 5: 37 - 42 = 2

- Інтервал 6: 43 - 48 = 3

При додаванні абсолютної частоти кожного класу, вона повинна дорівнювати загальній кількості вибірки; в даному випадку 30.

Згодом обчислюється відносна частота кожного інтервалу, розділяючи абсолютну частоту цього інтервалу на загальну кількість спостережень:

- Інтервал 1: fi = 9 = 30 = 0.30

- Інтервал 2: fi = 9 = 30 = 0.30

- Інтервал 3: fi = 5 = 30 = 0,1666

- Інтервал 4: fi = 2 = 30 = 0,0666

- Інтервал 5: fi = 2 = 30 = 0,0666

- Інтервал 4: fi = 3 = 30 = 0,10

Потім можна скласти таблицю, яка відображає дані, а також діаграму від відносної частоти по відношенню до отриманих інтервалів, як це видно з наступних зображень: \ t

Таким чином, правило Sturges дозволяє визначити кількість класів або інтервалів, в яких можна розділити вибірки, щоб узагальнити вибірку даних за допомогою підготовки таблиць і графіків..

Список літератури

  1. Alfonso Urquía, М. V. (2013). Моделювання та моделювання дискретних подій. UNED,.
  2. Альтман Наомі, М. К. (2015). "Проста лінійна регресія". Методи природи .
  3. Antúnez, R. J. (2014). Статистика в освіті. Цифровий UNID.
  4. Fox, J. (1997). Прикладний регресійний аналіз, лінійні моделі та пов'язані методи. Публікації SAGE.
  5. Умберто Ллінас Солано, С. Р. (2005). Описова статистика і розподіли ймовірностей. Університет Півночі.
  6. Пантелеева О. В. (2005). Основи ймовірностей і статистика.
  7. O. Kuehl, M. O. (2001). Дизайн експериментів: статистичні принципи проектування та дослідження. Редактори Thomson.