Медиана – это значение, которое делит упорядоченный набор данных ровно пополам. Представьте себе линейку чисел, выстроенных по возрастанию. Медиана – это число, которое находится точно посередине: половина значений меньше его, половина – больше.
В статистике часто приходится обобщать большой объем информации одним числом. Обычно для этого используют три базовых инструмента – это среднее арифметическое, медиана и мода. Как и зачем их находить – расскажем далее.
В отличие от среднего арифметического, медиана устойчива к выбросам. То есть единичные, очень большие или очень маленькие значения (аномалии) не будут сильно влиять на значение медианы.
Чтобы было понятнее, рассмотрим пример.
Представьте, что мы считаем среднюю зарплату в небольшой компании. Здесь работают десять сотрудников с зарплатой 50 000 рублей и один директор с зарплатой 500 000 рублей.
Если мы посчитаем среднюю зарплату с помощью среднего арифметического, то картина будет следующей:
(10 * 50 000 + 500 000) / 11 = 90 909 рублей.
В то время как значение медианы будет равняться 50 000 рублей.
Среднее арифметическое сильно искажено высокой зарплатой директора и не отражает реальную картину. Медиана же показывает, что большинство сотрудников получают 50 000 рублей. Так картина выглядит более реалистичной.
Одна заявка сразу в несколько МФО — выше шанс одобрения.
Для начала нужно упорядочить все числа в медиану ряда чисел по возрастанию (или убыванию).
Затем посчитать, сколько всего чисел в вашем наборе (обозначим это количество как n).
Если n нечетное: медиана – это число, стоящее на позиции (n + 1) / 2.
Для дискретного ряда с нечетным количеством наблюдений (n):
Me = x((n+1)/2),
где x((n+1)/2) — значение элемента, находящегося в позиции (n+1)/2 в упорядоченном ряду.
Медиана при четном количестве значений
Если n четное: медиана – это среднее арифметическое двух чисел, стоящих на позициях n / 2 и (n / 2) + 1.
Для дискретного ряда с четным количеством наблюдений (n):
Me = (x(n/2) + x(n/2+1)) / 2,
где x(n/2) и x(n/2+1) — значения элементов, находящихся в позициях n/2 и n/2+1 в упорядоченном ряду.
Теперь к примерам:
Пусть дан нечетный ряд: 1, 3, 5, 7, 9. Здесь n = 5. Медиана = (5 + 1) / 2 = 3 (число на 3-й позиции).
Четный ряд: 2, 4, 6, 8. Здесь n = 4. Медиана = (4 / 2 = 2, (4 / 2) + 1 =3) (4 + 6) / 2 = 5 (среднее арифметическое чисел на 2-й и 3-й позициях).
Медиана в статистике особенно полезна в тех случаях, когда данные не распределены равномерно и содержат «выбросы».
Представьте себе анализ цен на квартиры в городе N:
Большинство квартир стоят в диапазоне от 3 млн до 5 млн рублей. Но есть несколько элитных жилплощадей стоимостью 50 млн рублей. Использование среднего арифметического цен покажет нереалистичную цифру. Медиана же даст более адекватное представление о типичной стоимости жилья.
Вместе с медианой в статистике часто используется мода. Мода – это самое часто встречающееся значение в наборе данных.
Здесь тоже будет проще объяснить на примере:
Есть ряд чисел 1, 2, 2, 3, 4, 2, 5. Мода здесь будет равна двум (потому что двойка встречается чаще других чисел).
Мода и медиана дают разные представления о данных и дополняют друг друга.