Еще великий философ и экономист Карл Маркс в свое время утверждал, что цитатам в Интернете верить нельзя (в статье Auf die Frage der genauen Zitat). К сожалению, наследие этого человека ныне почти забыто: многие бездумно распространяют в социальных сетях картинки и тексты с «мудрыми изречениями», «афоризмами» и «фактами», не имеющими никакого отношения ни к их авторам, ни к реальности. Это неприятно, но, в принципе, не так уж страшно — люди всегда слушали всякую чушь и передавали ее друг другу, сейчас сменился лишь способ передачи. Забавно, что иногда сами передающие не верят в то, что цитируют, а чаще всего им просто безразлично, что там написано: расшарить картинку с цитатой, которую до тебя расшарили 1 488 человек, включая 23 френда, — это своего рода акт социализации, не более того.
Хуже другое: распространение информационного мусора практикуется в СМИ, даже во вполне приличных. Пока еще этот мусор далек по уровню бредовости от лучших образцов «афоризмов», да и выглядит вполне пристойно — с цифрами, процентами, графиками. Часто даже прожженные скептики и зануды типа меня с лету не отличают дезинформацию от информации, хотя в большинстве случаев сомнение все же появляется.
На этот раз моя система предупреждения о «странной» информации сработала при ознакомлении с данными исследования Национального бюро кредитных историй об уровне закредитованности населения в регионах России. Читая колонку коллеги — Игоря Моисеева, я не мог отделаться от ощущения, что выражение «в Челябинске кредиты брали 99,6% экономически активного населения» выглядит как минимум требующим проверки, о чем и написал там же в комментариях. И таки не поленился проверить. Получилось забавно.
Для выяснения истины пришлось не только побеспокоить представителей НБКИ (которые оказались весьма отзывчивыми и приятными в общении), но и погрузиться в тонкости статистической терминологии, используемой Федеральной службой государственной статистики (кстати, почему «государственной» статистики? Неужели есть еще какая-то федеральная служба частной статистики? Или антигосударственной?).
По словам представителей НБКИ, их аналитик взял данные о количестве кредитных историй с разбивкой по регионам из базы данных бюро и разделил каждое число на численность экономически активного населения соответствующего региона. Получившаяся доля по каждому региону, переведенная в проценты, и стала результатом исследования. Вроде бы логично.
Попробуем понять, что стоит за каждым параметром. Количество кредитных историй — это количество отдельных людей, которые в период с 2005 года по середину 2013-го брали какой-либо кредит. Если человек брал несколько кредитов, история все равно одна. Если человек менял паспорт, его новые данные вносятся в старую историю. В этом смысле все чисто — моя версия о возможном дублировании данных не прошла. Однако если человек, попавший в базу данных, умер, то его кредитная история все равно остается активной. Очевидно, что какое-то количество людей, бравших кредиты в последние восемь лет, покинули наш мир, то есть в базе есть в прямом смысле этого слова «мертвые души».
Впрочем, важнее другое (это станет понятно позже) — в базе данных НБКИ представлены кредитные истории самых разных слоев и групп населения: работающих людей, пенсионеров, студентов, домохозяек, рантье и пр. В наше время, когда кредиты доступны практически всем, ничего странного в таком разнообразии нет, это совершенно нормально. Кроме того, за восемь лет статус многих попавших в базу изменился:
Теперь о втором показателе — численности «экономически активного населения». В статистике Росстата это совершенно определенный термин, имеющий строгое значение, без возможности какого-либо свободного толкования. Экономически активное население — это жители данного региона (или всей страны) в возрасте от 15 до 72 лет, занятые или безработные. Занятые — это люди, работающие по найму (в том числе находящие в отпусках, на больничном) или на себя (но именно работающие, то есть производящие товары или оказывающие услуги за деньги). Безработные — это люди, не имеющие работы, но активно ищущие ее на момент проведения подсчета и готовые быстро приступить к работе.
Говоря иначе, к экономически активному населению не относятся: неработающие студенты, неработающие пенсионеры, домохозяйки (если они не ищут работу), владельцы бизнеса, не занимающиеся непосредственно управлением (только получающие дивиденды), любые другие люди, не имеющие в данный момент работу, но пока (или совсем) не желающие искать новую. А также все дети в возрасте до 15 лет (но они нас в данном случае не интересуют) и пожилые люди в возрасте более 72 лет (а вот они вполне могли получать кредиты 5—7 лет назад и попасть в базу НБКИ). В общей сложности к экономически активному населению относится 67—68% населения, причем среди женщин экономически активны лишь 62—63%.
Итак, получается, что аналитик НБКИ решил разделить количество людей в группе, включающей умерших, домохозяек, неработающих пенсионеров и студентов, а также временно отдыхающих от работы и прочих подобных, на количество людей в группе, не включающей все эти категории. Причем часть людей, учитываемых в базе НБКИ, за последние годы поменяли статус и даже если и входили в экономически активное население ранее, то теперь в него не входят. Естественно, аналитик получил сильно завышенные данные. Не сомневаюсь, что уже очень скоро — буквально в ближайшие месяцы — в некоторых регионах подсчитываемый НБКИ показатель «доля людей, имеющих кредитную историю, в экономически активном населении» превысит 100%. Крайне интересно будет посмотреть, как они это объяснят. Пока мой вопрос на этот счет был воспринят представителем НБКИ с юмором: «Каким образом?)) То есть все экономически активное население плюс еще кто?» Вот и узнаем, «плюс еще кто».
Дошедший до этого места читатель уже понял: исследование НБКИ методологически ошибочно, то есть ошибка закладывается изначально, при отборе данных для сравнения. Никакой информационной ценности в представленных в исследовании числах нет: с тем же успехом общее количество кредитных историй можно разделить на количество мужчин в регионе или на количество блондинок и получить некий результат, распространив затем его в СМИ. Показатель 99,64% для Челябинской области не говорит о том, что практически все экономически активное население региона охвачено кредитами, — он, вероятно, показывает, что там почему-то относительно много кредитов выдается (или выдавалось) экономически неактивному населению, но и эта гипотеза требует проверки.
Данное исследование НБКИ — лишь один из множества примеров красивой, популярной среди журналистов и полностью бессмысленной «аналитики», заполняющей околоэкономические и даже массовые СМИ. Но, как и в случае с «афоризмами», это никого не волнует: различные компании и «аналитики» за счет таких публикаций получают бесплатный пиар, сайты и газеты заполняют свои страницы статистикой и красивой инфографикой, привлекающей внимание публики, читатели испытывают эмоции (ради чего, собственно, и читают эти сайты и газеты). Все при деле, все довольны. Никакой злой воли и тонкого расчета здесь нет — обычный эволюционный процесс снижения качества информации,
Вот только не доверять спаму мы уже, кажется, научились, а не доверять цифрам и графикам — пока нет. Пора учиться.
Мнение автора может не совпадать с мнением редакции