Раз в две недели я могу направлять вам информационный дайджест и даты своих бесплатных вебинаров.

 

Обманчивая статистика

288 Обманчивая статистика

Недавно вышла очередная статистика от компании Ромир, которая специализируется на различных социально-экономических исследованиях. Так вот, согласно данной статистике, «средний чек достиг минимальных показателей за два года и по сравнению с июнем его значение уменьшилось на 17 рублей в денежном выражении». И тут же, при перепечатке данной новости, различные СМИ начали делать выводы, что «россияне стали меньше тратить денег при походе в магазин», «россияне стали меньше платить в магазинах», «петербуржцы стали экономить на продуктах», «саратовцы стали меньше тратить при походе в магазин», «расходы жителей УрФО снизились», «россияне сократили траты до минимума» и т.д. 

А вот интересно, по мнению этих СМИ, «стали меньше платить в магазинах» и «стали меньше есть» это одно и то же или нет? И  вообще, откуда Ромир берет данные для своей статистики и насколько правомерны обобщения ряда СМИ о том, что россияне стали экономить и сократили расходы?

Вот что пишет по поводу получаемых данных сам Ромир. «Индекс Среднего чека рассчитывается на основе данных скан-панели домохозяйств Romir Scan Panel. Исследовательская скан-панель домохозяйств Romir Scan Panel основана на данных потребления 30 000 россиян, 11 500 домохозяйств в 220 городах с населением более 10 тысяч человек, репрезентирующих покупательское и потребительское поведение жителей городов России. Участники панели сканируют штрих-коды всех купленных товаров, приносимых домой. Данные сканирования в онлайн режиме поступают в базу данных скан-панели».

Из описания не совсем понятна процедура. А если у товара нет штрих-кода и человек купил фрукты и овощи на рынке? Средний чек – это все расходы в один день? И если нет, то может люди просто стали чаще ходить в разные магазины? И как влияет величина промо при покупках, например, если человек купил больше товаров, но по меньшей цене, он стал экономить или сократил свои расходы?

Ну и, конечно, самый главный вопрос касается величины выборки и количества  максимальных отклонений? В среднем у 30 000 человек средний чек (что бы это не значило) уменьшился на 17 рублей. А какие максимальные отклонения от средней величины? Может 10% из данной выборки уехали в отпуск и кушают в ресторанах, уменьшая средний чек, а у остальных он все-таки вырос? И действительно ли на основании потребления отобранных 30 тыс. человек можно делать вывод о ситуации в многомиллионной стране? Нет ли здесь ложной корреляции?

И еще, вот какая странность получается. Средний чек в Ромире падает, а вот у лидера российского ритейла, X5 Retail Group  я бы не сказал что падает. Вот данные по Х5. И выборка у них побольше чем в Ромире. Как такое может быть?

Статистика – это штука, с которой нужно обращаться очень осторожно. Я уже как-то говорил, что в статистике очень важен даже не анализ средних значений, а анализ отклонений от среднего – именно они дают главную пищу для анализа. Не делайте выводов из статистики, только на основе статистики, особенно когда речь идет о маленькой выборке из больших данных.