Войти в почту

Глава Росстата: Работа с Big Data становится одним из ключевых направлений развития статистики

Росстат ежемесячно наблюдает за ценами на более чем пятисот наименований товаров и услуг. Как официальная статистика соотносится с ощущениями людей и чем большие данные помогают в работе, "РГ" рассказал руководитель Федеральной службы государственной статистики Сергей Галкин.

Глава Росстата: Работа с Big Data становится одним из ключевых направлений развития статистики
© Российская Газета

Сергей Сергеевич, большие данные сегодня называют новой нефтью. Росстат выглядит медленным и неповоротливым на фоне конкурентов, которые быстрее работают с Big Data. Почему так произошло?

Сергей Галкин: Действительно, поток больших данных становится все мощнее и интенсивнее. Первыми с ними начали работать те, кто их же и генерирует - операторы мобильной связи, онлайн-платформы, интеграторы трафика. Для нас, как и для статистических служб всего мира, большие данные - это новый класс источников информации. И мы постепенно учимся их использовать, оценивая их с точки зрения надежности, достоверности, качества.

На мой взгляд, роль статистических служб резко возрастает. Больших данных становится все больше, одни и те же цифры рождают различные интерпретации, трактовки, а ведь на их основе все чаще принимаются стратегические решения - и бизнесом, и властью. Это прогресс, но в то же время высока цена ошибки, риск потеряться в разнокалиберных наборах данных. Их нужно оценить, верифицировать. Должны быть методологические ориентиры.

Мы видим такие критерии верификации. Источники данных должны быть устойчивыми и доступными для анализа в долгосрочной перспективе. Их происхождение, методология сбора и анализа должны быть понятными. Необходимо четко понимать, насколько данные охватывают наблюдаемое явление - на 100% или нет? От этого зависит интерпретация. Еще один немаловажный аспект - возможный конфликт интересов у источника данных. Например, отсутствие какого-то количества "лучших" записей может ухудшить итоговый результат, а "худших" - улучшить. Статслужбы очень серьезно относятся к вопросам охвата и описания генеральных совокупностей явлений. Для нас это вопрос о ценности данных.

Сейчас стратегическая задача - научиться превращать сырье, а большая часть Big Data пока именно сырье, в готовые наборы статданных, с которыми уже впоследствии смогут работать конечные пользователи. В конечном итоге большие данные станут частью статистики, обогащая, но не искажая ее. Для этого нужно обеспечить накопление массивов информации, разработать алгоритмы ее обработки или верифицировать чужие алгоритмы. Поэтому мы формируем методологический стандарт, своеобразный знак качества.

Также решаем еще одну стратегическую задачу - ускоряем само статистическое производство Цель - оперативно давать актуальную информацию здесь и сейчас. К примеру, ставим перед собой цель сократить время разработки методологии и запуска в статпроизводство большинства новых показателей с одного-двух лет до одного-шести месяцев.

Росстат уже сам работает с большими данными?

Сергей Галкин: Да, в частности, при анализе информации из фискальных чеков. Мы выделяем два ключевых этапа. Пока у нас нет стопроцентной уверенности в их происхождении, большие данные будут служить нам в качестве источника верификации информации, собираемой традиционным способом. Мы сможем сверять общие тренды. На втором этапе они постепенно будет вытеснять привычные источники данных.

Кроме того, мы активно анализируем международный опыт. Видим, что работа с Big Data становится одним из ключевых направлений развития статистики - разрабатываются рекомендации, создаются учебные хабы, проводятся эксперименты. И на сессии статистического комитета ООН в Нью-Йорке, и в ходе международной конференции по работе с данными, которая проходила в Китае, все говорили об одном - как включать большие данные в расчет тех или иных показателей так, чтобы не потерять в качестве. Успешных проектов пока немного. В основном речь идет про расчет потребительских цен на основе информации торговых сетей, мобильных операторов и сайтов-агрегаторов. Есть небольшое число примеров в сфере туризма, статистики населения, в том числе миграции, транспортной статистики. Видим, что пока быстрее продвигаются страны с небольшой территорией, компактными экономиками, относительно небольшим количеством провайдеров данных и бизнес-единиц (ритейлеров и др.). Но такие большие страны, как Россия и Китай, например, также вырабатывают свои подходы.

Вы, по-прежнему, активно участвуете в международных проектах?

Сергей Галкин: Мы продолжаем сотрудничать с институтами, входящими в систему служб и организаций ООН. В первую очередь для того, чтобы гарантировать качество методологии Росстата на уровне лучших мировых стандартов. В этом году, например, пройдет крупнейшая конференция по статистике труда под эгидой МОТ. Мы понимаем, что будут обсуждаться новые тренды в занятости и то, как их оценивать с помощью инструментов статистики. После предыдущей конференции мы начали считать платформенную занятость.

Отдельный важный трек - активизация сотрудничества со стаслужбами на постсоветском пространстве. В этом году Россия председательствует в Совете статистических служб стран СНГ. Мы уже предложили обширный пакет совместных проектов и программ. Будем создавать общий банк данных, поможем развивать методологию проведения статистических исследований, улучшать качество сбора отчетности и расчета показателей. Обеспечивать сопоставимость данных.

Наращиваем сбор данных не напрямую от респондентов, а от других ведомств. Это исключит повторный сбор данных и в итоге снизит нагрузку на бизнес

Как быть с тем, что граждане зачастую сомневаются в данных Росстата, особенно в цифрах по инфляции?

Сергей Галкин: Мы стараемся подробно рассказывать о том, как считаем инфляцию. Даже сделали специальный текст с инфографикой на сайте Росстата. И продолжим эту разъяснительную работу, важно чтобы граждане понимали из чего складываются наши цифры.

Например знали, что Росстат публикует не одну итоговую цифру по стране в целом, а дает еще значение индекса потребительских цен и по регионам. А в них уровень инфляции может существенно отличаться. Например, в мае инфляция по стране в целом - 0,3%, а в Ненецком автономном округе индекс за месяц вырос на 1,5%. При этом в Санкт-Петербурге он остался на уровне 0,3%.

Кроме, того Росстат ежемесячно наблюдает более 500 товаров и услуг. Это продукты питания, непродовольственные товары, различные услуги - от медицинских услуг, стоимости проезда в метро или в поездах, до самых простых бытовых. И можно увидеть, что мороженая рыба в мае подорожала на 0,9%, а куриные окорочка - почти на 2%. При этом огурцы подешевели более, чем на 35%, а помидоры на 26,1%.

Росстат ежемесячно наблюдает за динамикой цен более пятисот наименований товаров и услуг. Фото: Nico ElNino/istock

Наши сотрудники обходят сотни тысяч торговых точек и организаций сферы услуг. По каждому наименованию товару берется продукция 3-5 конкретных торговых марок, которые пользуются наибольшим спросом в этом регионе. Это большая и серьезная работа. Дальше данные аккумулируются, и выдается картина для всей страны.

Как это соотносится с ощущениями людей - вопрос, во многом, психологический. Но в этой сфере ощущения и ожидания имеют большое значение. Росстат же бесстрастно фиксирует динамику цен по выверенной методологии.

Одной из бурно растущих сфер экономики стала онлайн-торговля. Росстат ее тоже считает?

Сергей Галкин: Перетекание потребительского спроса из традиционной офлайн-торговли в онлайн-сферу - уже свершившийся факт. Интернет-платформы стали привычным инструментом в повседневной жизни каждого из нас. По итогам 2022 года доля интернет-торговли уже достигла 6,0% в общем объеме розничной торговли, превысив 1,3 трлн руб.

Поэтому среди наших важных приоритетов - работа с компаниями, ведущими продажи через интернет-платформы, в особенности - маркетплейсами. Мы будем с ними работать по тем же принципам, которые я описывал ранее. То есть через получения статистической информации из их учетных систем.

Еще одна актуальная тема - это туризм. Как ведется статистика по туризму в Росстате?

Сергей Галкин: 2022 год стал ключевым для резкого увеличения объемов публикации данных о внутреннем и внешнем туризме в России. В целом, за два года увеличили число показателей, публикуемых ежемесячно в четыре раза - с двух до восьми. Причем по большинству из них мы даем информацию по регионам. А ежегодно мы еще и публикуем цифры по муниципалитетам.

Впервые начали ежемесячно публиковать оценки турпотока, как по России в целом, так и на региональном уровне. Для этого была разработана методика, соответствующая международным рекомендациям ООН и учитывающая лучшие страновые практики.

Ежемесячно публикуем информацию о коллективных средствах размещения. Это наш профессиональный термин, под которым понимаются гостиницы, пансионаты, санатории, дома отдыха. Даем цифры об их числе, вместимости и ряд других показателей.

Кстати, чтобы получать эти цифры нам совместно с Минэкономразвития пришлось провести довольно серьезную работу. Мы ее назвали инвентаризацией. Начали с информации о гостиницах, санаториях, домах отдыха. Но это не дает всей картины. Например, долгое время не учитывались круизные суда, пассажирские вагоны, которые тоже используются, как гостиницы.

Но пройдена только часть пути. Важна учесть региональные особенности. У каждой территории есть свой профиль потоков перемещения людей - трудовые, туристские, транзитные. Их нужно, разделить и проанализировать, чтобы получить реальную картину.

Кто главный потребитель этих данных?

Сергей Галкин: С точки зрения принятия стратегических решений о развитии туристской отрасли или для понимания, как она развивается сейчас - Минэкономразвития, федеральные органы власти и управленческие команды.

Но на мой взгляд бизнес - не менее активный и важный пользователь этой информации. Ему инвестировать в создание инфраструктуры, в формирование привлекательности туристских кластеров. А для этого нужны надежные цифры, на которые можно положиться. Росстат все эти данные размещает на своем сайте Росстата. Они доступны каждому.

Как изменится работа с респондентами?

Сергей Галкин: Росстат - как весы: на одной чаше - статистические показатели, которые нужны, чтобы принимать управленческие решения. На другой - наши респонденты, их временные и административные издержки. Поэтому улучшение взаимодействия с респондентами - наш постоянный фокус. Задача - сделать его максимально простым и комфортным для них.

Идем к этому разными путями. Например, наращиваем сбор данных из административных источников - не напрямую от респондентов, а от других ведомств. Это исключит повторный сбор данных - и в итоге снизит нагрузку на бизнес. Для этого необходимо упорядочить и систематизировать все данные, собираемые государством.

Также ищем возможности для сбора отчетности из учетных систем респондентов, упрощаем рекомендации по заполнению форм отчетности. Это упростит само взаимодействие с нами, сделает его более технологичным. При этом хотим, чтобы и респонденты получали какие-то бонусы от работы с Росстатом, ощущали ценность статистики. Например, планируем предоставлять отраслевые и территориальные наборы данных, настроенных под развития бизнеса. Создаем специализированное управление по работе с корпоративными респондентами.

Мы ищем новые формы взаимодействия с респондентами. Да, можно обязать предприятия, бизнесменов сдавать те или иные формы отчетности, но эффективнее создать им такие условия, которые бы мотивировали их к сотрудничеству с нами.

А для этого нужен индивидуальный, адресный подход. Уже провели сегментацию всех респондентов на классы - крупнейшие конгломераты, большие предприятия, малый и средний бизнес. Для каждого сегмента будем создавать свою логику взаимодействия. Сейчас уже отобраны пилотные предприятия из каждого класса, с которыми мы тестируем новые подходы.

В чем разница в смысле статистики?

Сергей Галкин: У крупнейших предприятий, которые часто являются многоотраслевыми холдингами с активами по всей стране, есть подразделения, которые занимаются подготовкой статистической отчетности. Здесь важно синхронизироваться. Таким респондентам проще направлять в Росстат комплексную отчетность, включающую данные по всем подразделениям. Нам это позволяет учитывать внутренние бизнес-процессы корпораций.

Мы уже ведем несколько проектов с холдингами, которые позволят точнее оценивать, например, объемы инвестиций.

У среднего и, особенно, малого бизнеса свой приоритет - снижение числа форм отчетности, ее упрощение, переход к сбору минимально необходимых наборов показателей. В том числе через электронные кабинеты, в которых используются все современные формы помощи респондентам - всплывающие подсказки, предзаполнение отдельных строк, календарь сдачи отчетности и многое другое. Важным шагом вперед станет принятие законопроекта, разработанного совместно с Минэкономразвития: сократится число показателей, по которым отчитывается малый бизнес. Будет до десяти общеэкономических показателей и конечный перечень отраслевых, которые варьируются в зависимости от вида деятельности. Но не более 20-30 для каждого респондента.

Наконец, очень важна и отраслевая специфика. В этом году мы запустили работу по описанию отраслевых моделей данных. Сейчас разные управления Росстата координируют сбор различных форм статотчетности - одних интересуют финансовые результаты, других - зарплаты, цены, третьих - инвестиции. Мы введем сквозной реестр респондентов и их показателей - это даст полную многомерную картину отрасли, на 360 градусов. В конечном итоге мы повысим скорость обработки и анализа данных, это позволит отраслевым ведомствам и бизнесу повысить качество принимаемых решений.

Это планы применительно к бизнесу. А что изменится в работе с людьми?

Сергей Галкин: Будем работать с ними еще активнее. Наши крупнейшие исследования включают опросы 50-60 тысяч домохозяйств. То есть мы регулярно общаемся с сотнями тысяч наших сограждан. Собирается громадный объем информации. Например, мы узнаем не только про уровень безработицы, но и про то, как люди ищут работу, сколько времени у них уходит на это.

Однако сегодня перед статслужбами стоит глобальный вызов - классические каналы общения с населением становятся менее эффективными

Наша задача - прийти к тому, чтобы большая часть базовой информации о людях собиралась на основе межведомственного взаимодействия из административных источников. При этом статистические обследования населения должны постепенно перемещаться в цифровые каналы. Например, в портал "Госуслуги", мы обкатали его в ходе прошедшей переписи населения.

А каким будет сам Росстат в 2030 году?

Сергей Галкин: Я считаю, что Росстат должен быть одной из лучших статистических служб мира. Ключевой критерий - качество предоставление услуг. Мы хотим, чтобы Росстат стал эффективной сервисной службой, работающей для человека, общества, страны в целом. Потребителям - достоверная и актуальная информация, кастомизация взаимодействия с всеми категориями пользователей - от коллег в органах власти и бизнеса, до экспертов, журналистов, студентов. Для респондентов - минимум лишней нагрузки, адаптированные формы отчетности и электронные каналы взаимодействия.

Конечная цель - двигаться вместе с ускоряющимся миром, выйти на быстрый расчет информации и анализ показателей. Из отдельных пазлов должна складываться многомерная картина того, как работает бизнес и живет страна. И это критически важно для развития - все понимают, что будущее за теми, кто при принятии решений опирается на полные и достоверные данные. Наша цель - дать их нашему государству и обществу. В этом и есть главная миссия Росстата на ближайшие годы.