Центральні заходи щодо тенденцій для згрупованих даних



The заходи центральної тенденції згрупованих даних вони використовуються в статистиці для опису певної поведінки групи наданих даних, наприклад, близьких до них, середніх даних, зібраних серед інших.

Коли приймається велика кількість даних, корисно групувати їх, щоб мати краще їх порядок і таким чином мати змогу обчислити певні заходи центральної тенденції.

Серед найважливіших заходів центральної тенденції - середнє арифметичне, медіана і режим. Ці цифри говорять про певні якості про дані, зібрані в певному експерименті.

Для використання цих заходів необхідно спочатку дізнатися, як групувати набір даних.

Згруповані дані

Для групування даних спочатку необхідно обчислити діапазон даних, який отримується вирахуванням найвищого значення за вирахуванням найменшого значення даних.

Потім виберіть число "k", яке є числом класів, в яких потрібно групувати дані.

Ми переходимо до поділу діапазону між "k", щоб отримати амплітуду класів, які будуть згруповані. Це число C = R / k.

Нарешті починається групування, для якого вибирається менша кількість, ніж найменше значення отриманих даних..

Це число буде нижньою межею першого класу. До цього додається C. Отримане значення буде верхньою межею першого класу.

Потім до цієї величини додають C і отримують верхню межу другого класу. Таким чином, ви продовжуєте, поки не отримаєте верхню межу останнього класу.

Після групування даних можна перейти до розрахунку середнього значення, медіани та моди.

Щоб проілюструвати, як обчислюється середнє арифметичне, медіана і режим, ми продовжимо приклад.

Приклад

Тому при групуванні даних ви отримаєте таку таблицю:

Три основні заходи центральної тенденції

Тепер перейдемо до розрахунку середнього арифметичного, медіани та режиму. Наведений вище приклад буде використаний для ілюстрації цієї процедури.

1 - середнє арифметичне

Середнє арифметичне складається з множення кожної частоти на середнє з інтервалу. Потім всі ці результати додаються і, нарешті, діляться на загальні дані.

Використовуючи попередній приклад, ми отримаємо, що середнє арифметичне дорівнює:

(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111

Це вказує на те, що середнє значення даних у таблиці становить 5.11111.

2- Середній

Щоб обчислити медіану набору даних, спочатку всі дані впорядковуються від найменшого до найбільшого. Можуть бути представлені два випадки:

- Якщо номер даних непарний, то медіаною є дані, які знаходяться прямо в центрі.

- Якщо число даних рівне, то медіана - це середня величина двох даних, що залишаються в центрі.

Коли йдеться про згруповані дані, розрахунок медіани здійснюється таким чином:

- N / 2 обчислюється, де N - загальні дані.

- Перший інтервал шукається, де накопичена частота (сума частот) більше, ніж N / 2, і вибирається нижня межа цього інтервалу, званий Li..

Медіану задають за такою формулою:

Me = Li + (Ls-Li) * (N / 2 - накопичена частота перед Li) / частота [Li, Ls]

Ls - верхня межа діапазону, згаданого вище.

Якщо використовується таблиця даних, то N / 2 = 18/2 = 9. Накопичені частоти 4, 8, 14 і 18 (по одному для кожного рядка таблиці).

Тому третій інтервал повинен бути обраний, оскільки накопичена частота більше, ніж N / 2 = 9.

Отже, Li = 5 і Ls = 7. Застосовуючи формулу, описану вище, потрібно:

Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.

3 - Мода

Мода - це значення, яке має найбільшу частоту серед всіх згрупованих даних; тобто значення, яке повторюється більшість разів у вихідному наборі даних.

Якщо у вас дуже великий обсяг даних, для обчислення режиму згрупованих даних використовується наступна формула:

Mo = Li + (Ls-Li) * (частота Li - Частота L (i-1)) / ((Частота Li-частоти L (i-1)) + (частота Li-частоти L ( i + 1)))

Інтервал [Li, Ls) - це інтервал, в якому знайдено найбільшу частоту. Для прикладу, зробленого в цій статті, ми маємо такий спосіб:

Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4) = 5 + 2 * 2/4 = 5 + 1 = 6.

Інша формула, яка використовується для отримання приблизного значення для моди, полягає в наступному:

Mo = Li + (Ls-Li) * (частота L (i + 1)) / (частота L (i-1) + частота L (i + 1)).

За допомогою цієї формули облікові записи є такими:

Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.

Список літератури

  1. Bellhouse, D. R. (2011). Авраам Де Мойвр: встановлення етапу класичної ймовірності та її застосування. CRC Press.
  2. Cifuentes, J. F. (2002). Вступ до теорії ймовірностей. Національний університет Колумбії.
  3. Daston, L. (1995). Класична ймовірність в епоху Просвітництва. Прінстонський університет.
  4. Larson, H. J. (1978). Введення в теорію ймовірностей і статистичне виведення. Редакція Limusa.
  5. Martel, P.J., & Vegas, F.J. (1996). Імовірність та математична статистика: застосування в клінічній практиці та управлінні здоров'ям. Ediciones Díaz de Santos.
  6. Vázquez, A.L., & Ortiz, F.J. (2005). Статистичні методи вимірювання, опису та контролю мінливості. Університет Кантабрії.
  7. Vázquez, S. G. (2009). Математичний посібник для доступу до університету. Редакційний центр досліджень Ramon Areces SA.