это значение, которое делит упорядоченный набор данных ровно пополам. Представьте себе линейку чисел, выстроенных по возрастанию. Медиана – это число, которое находится точно посередине: половина значений меньше его, половина – больше.
В статистике часто приходится обобщать большой объем информации одним числом. Обычно для этого используют три базовых инструмента – это среднее арифметическое, медиана и мода. Как и зачем их находить – расскажем далее.
В отличие от среднего арифметического, медиана устойчива к выбросам. Что это значит? Это значит, что единичные, очень большие или очень маленькие значения (аномалии) не будут сильно влиять на значение медианы.
Чтобы было понятнее, рассмотрим пример.
Представьте, что мы считаем среднюю зарплату в небольшой компании. Здесь работают десять сотрудников с зарплатой 50 000 рублей и один директор с зарплатой 500 000 рублей.
Если мы посчитаем среднюю зарплату с помощью среднего арифметического, то картина будет следующей:
(10 * 50 000 + 500 000) / 11 = 90 909 рублей.
В то время как значение медианы будет равняться 50 000 рублей.
Среднее арифметическое сильно искажено высокой зарплатой директора и не отражает реальную картину. Медиана же показывает, что большинство сотрудников получают 50 000 рублей. Так картина выглядит более реалистичной.
Одна заявка сразу в несколько МФО — выше шанс одобрения.
Для начала нужно упорядочить все числа в медиану ряда чисел по возрастанию (или убыванию).
Затем посчитать, сколько всего чисел в вашем наборе (обозначим это количество как n).
Если n нечетное: медиана – это число, стоящее на позиции (n + 1) / 2.
Для дискретного ряда с нечетным количеством наблюдений (n):
Me = x((n+1)/2),
где x((n+1)/2) — значение элемента, находящегося в позиции (n+1)/2 в упорядоченном ряду.
Медиана при четном количестве значений
Если n четное: медиана – это среднее арифметическое двух чисел, стоящих на позициях n / 2 и (n / 2) + 1.
Для дискретного ряда с четным количеством наблюдений (n):
Me = (x(n/2) + x(n/2+1)) / 2,
где x(n/2) и x(n/2+1) — значения элементов, находящихся в позициях n/2 и n/2+1 в упорядоченном ряду.
Теперь к примерам:
Пусть дан нечетный ряд: 1, 3, 5, 7, 9. Здесь n = 5. Медиана = (5 + 1) / 2 = 3 (число на 3-й позиции).
Четный ряд: 2, 4, 6, 8. Здесь n = 4. Медиана = (4 / 2 = 2, (4 / 2) + 1 =3) (4 + 6) / 2 = 5 (среднее арифметическое чисел на 2-й и 3-й позициях).
Медиана в статистике особенно полезна в тех случаях, когда данные не распределены равномерно и содержат «выбросы».
Представьте себе анализ цен на квартиры в городе N:
Большинство квартир стоят в диапазоне от 3 млн до 5 млн рублей. Но есть несколько элитных жилплощадей стоимостью 50 млн рублей. Использование среднего арифметического цен покажет нереалистичную цифру. Медиана же даст более адекватное представление о типичной стоимости жилья.
Вместе с медианой в статистике часто используется мода. Мода – это самое часто встречающееся значение в наборе данных.
Здесь тоже будет проще объяснить на примере:
Есть ряд чисел 1, 2, 2, 3, 4, 2, 5. Мода здесь будет равна двум (потому что двойка встречается чаще других чисел).
Мода и медиана дают разные представления о данных и дополняют друг друга.