当前,新冠病毒肺炎疫情在国内已经得到有效控制,复工复产正在全面推进之中。那么,目前经济复苏的情况究竟如何?各行各业以及各地区的发展形势有何差异?百度公司最近发布的2篇论文 [1, 2] 研究发现,这些答案,都“藏”在海量的大数据里。

研究表明,百度地图的用户和商户数据情况与GDP走势呈现高度相关性,成为呈现行业和地区经济复苏情况的“晴雨表”。同时,百度地图、搜索和健康平台的数据显示,某一地区人口流动情况以及搜索习惯,与该地区的疫情形势紧密相关。由此可见,百度多维度大数据能够有效地为疫情发展及其社会影响“画像”。

中国传媒大学调查统计研究所所长、大数据挖掘与社会计算实验室主任沈浩表示,在抗击新冠肺炎疫情的斗争中,全国各地的政府、企业和科研机构都在探索运用大数据手段提升治理能力、加强抗疫效果。未来,百度的大数据不仅能够作为政府防控疫情的有益参考,同时也可以为推动复工复产、提振经济发展提供有力的决策依据。

L型、勾型、V型:百度大数据直观量化疫情对经济发展的冲击情况 [1]

成都闹市区的奶茶已经回归了往日的热闹,而天津旅游景区的小饭馆却迟迟难以复苏;西北县城的超市恢复了元气,长江中部的工厂则尚未将产量提升至疫情之前的平均水平……这些情况,百度大数据都“看”到了。

百度大数据的研究者在试图摸清地图数据与经济复苏情况的关联时,发现了两个关键因子——地图用户到店数量(Volumes of Visits to Venues,简称V3)与商户新开设的地理位置点数量(New Venues Created,简称NVC)。V3可以反映用户的活跃程度,NVC则反映商户的活跃程度。

于是,研究者将这两个数据的走势与GDP走势做成可视化图表,结果发现,NVC、V3与GDP的走势,呈现强烈的正相关,也就是说,地图用户到店的情况与商户新开设的地理位置点情况,可以反映经济活动的强弱。

图1:从2018年第一季度到2020年第一季度,每个季度的国内GDP与百度地图用户到店数量,新开设的地理位置点数量,呈现强烈正相关。(注:分析所用的数据皆为脱敏数据,所有处理环节均不涉及个体隐私。下同。)

那么,这一发现,除了作为经济活动的晴雨表,还有什么作用呢?

百度研究人员又做出了进一步的分析。他们对各个行业、各个地区省份的经济活跃程度进行了细致分析,结果发现,不同行业、不同地区之间,经济复苏情况呈现巨大差异,主要分为以下三类——L型、勾型、V型。

先来看L型。这一曲线显示复苏缓慢,说明受疫情影响很大,目前仍然无法回到2018年同期的水平;教育、交通运输、酒旅等行业遭受非常严重的打击。下图分别是机场、火车站、教育培训机构、酒店的用户到店情况。可以看到,代表今年情况的红色V3曲线,呈现“L”形状,依旧在低谷摇摆。

图2:上图为机场、火车站、教育培训机构、酒店的用户到店情况(V3)和新开设的地理位置点情况(NVC)

再来看勾型。虽遭受疫情影响,但是疫情缓和之后,能够恢复到2018年与2019年同期之间的经济水平。餐饮酒吧、休闲娱乐、公园景点等是典型的行业代表。这一复苏情况在V3的可视化图表里很像一个反写的“对勾”。

图3:勾型:疫情缓和之后,餐馆酒吧、娱乐设施、旅游景点等行业能够恢复到2018年与2019年同期之间的经济水平

最后看V型。尽管疫情的影响严重,但是一旦疫情缓和之后,能够快速触底反弹,恢复到2019年同期水平,甚至比那时情况更好。代表行业有工作居住的地点、商超、医院药店等。

图4:V型:疫情缓和之后,工作居住地点、商超、医院药店等景气程度快速反弹,走势看上去像字母V

研究人员用类似的思路,将全国经济按照区域进行分析,发现湖北、北京及天津的经济复苏情况为L型,复苏缓慢,与持续的疫情管控以及旅行限制有关;南部沿海、黄河中游、东部沿海、长江中游和北部沿海的数据显示出明显的勾型复苏趋势;大西北、东北和西南区域则展现出强劲的V型反弹趋势。

百度大数据研究专家表示,五大经济区(南部沿海,黄河中游,东部沿海、长江中游、北部沿海)高度依赖全球供应链的经济,在国内疫情结束之后,依然受到国际整体疫情和经济形势的影响,未能快速反弹,呈现中间态的勾型;而西北、东北、西南等地区经济对外依赖性相对较小,疫情感染人数没有其他五大经济区多,恢复快,经济经历短暂阵痛之后,触底反弹。

搜索COVID-9越多,疫情防控工作越好?百度大数据“揭秘”疫情防治、人口迁徙与搜索行为间的显著关联 [2]

百度大数据还发现了人口出行情况、搜索情况与疫情防控之间的紧密关联。

先来看第一项发现:从武汉移出到中国其他主要城市人口情况,与当地疫情传染情况的关系存在显著的正相关。

百度大数据统计了截至3月31日中国内地300个除湖北外主要城市的确诊感染人数,将其与1月23日迁入该城市的人口数做出了对比。

图5:截至2020年3月31日中国内地各主要城市确诊人数 (上图) /当地确诊率 (下图) vs 2020年1月1日至23日从武汉迁入人数

上面左图展示了全国主要城市每个城市从武汉迁入人数(x-轴)与截止到3月31日当地累计确诊人数(y-轴)的关联。二者存在显著正相关。说明,当地累计确诊人数与当地迁入的武汉人数存在直接的关联。

考虑到城市大小的关系,百度研究者也以当地感染率(每百万人平均感确诊人数)与从武汉迁入人数做出了分分析统计,如右图。结果依然是显著正相关。

由此可以得出结论——在武汉封城之前,从武汉迁入人口更多的城市,会有更高的感染人数;同理推断,武汉越早采取封城措施,则疫情波及范围越小。

   再来看第二项研究结果。数据显示,疫情越严重的地方,人均搜索COVID-19相关关键词的次数也越多。

图6:2020年1月33月31日中国大陆各主要城市人均COVID-19搜索次数 v.s 该城市确诊人数 (上图) /确诊率(下图)

可以看出,中国内地除湖北外主要城市确诊感染人数与该城市人均搜索COVID-19相关关键词的次数存在显著正相关。由此得出结论,可能是由于感染情况引发的恐慌心理,人们更愿意搜索相关信息。

百度的研究还发现,全国除湖北外主要城市的出行恢复率与当地人通过百度搜索COVID-19次数呈现显著的负相关。也就是说,人均通过百度搜索COVID-19关键字较多的城市,人们出行意愿更低、或是当地疫情管控措施更为严格 (在排除了其他潜在因素的偏相关性分析后,此关联依然显著)。

图7:截至2020年3月31日中国大陆各主要城市出行恢复率 v.s 该城市人均COVID-19相关信息搜索次数:上图(Log-Log Plot), 下图正常尺度 。

    可以看出,当人们主动搜索信息得到了更多有关疫情的消息时,便更愿意待在家里。可以说,百度数据对人口隔离政策和移动限制政策提供了重要参考。

大数据全面赋能疫情防控:真实掌握+有效预警+精准施策

从上数研究结果可以看出,百度地图、搜索和健康的多维度数据能够直观呈现疫情发展及其社会影响。沈浩认为,百度大数据对于征服开展疫情防控与社会治理而言,有着突出意义。

其一,有利于全面、真实、动态掌握疫情防控情况。平时访问发热门诊数量的人是否显著增多?疫情期间居家隔离情况执行如何?百度都能够第一时间给予直观、真实的数据化呈现。

其二,对可能发生的疫情相关风险提出预警。百度地图数据可以直接为疫情期间居家隔离政策、出行限制政策执行情况提供参考,对危险信号提出预警。

第三,动态掌复工复产、经济发展的真实情况,形成真实全面的“景气指数”。各地、各行业复工复产情况究竟如何?百度地图的商户和用户活跃程度,便可以给予客观的回应,作为政府机构精准施策的基础。

利用大数据提升社会治理能力也是中国政府近年来不断努力的方向。

去年12月,习近平总书记指出,积极推进我国应急管理体系和能力现代化。今年2月10日,习近平总书记在北京市调研指导疫情防控工作时强调,要运用大数据等手段,加强疫情溯源和监测。2月18日,工业和信息化部印发了《关于运用新一代信息技术支撑服务疫情防控和复工复产工作的通知》,提出有效应用信息化手段助力疫情防控和复工复产。在中央精神的指导下,社会各界纷纷探索以信息化途径高效开展疫情防控。

实际上,在新冠肺炎疫情发生之前,大数据在国内外公共卫生事件中的应用效果已经得到了较好的检验。此次疫情发生后,韩国、日本、新加坡等国家均采用了大数据手段防控疫情、指导经济活动,取得了良好的效果。

在中国,相较17年前的SARS疫情,大数据在此次新冠疫情防控中的作用尤为明显,涵盖个人健康状况认证、远程医疗问诊、应急物资调配等方方面面。

“互联网公司掌握社会许多层面的数据,政府一方面要对数据的合规性加强监管,另一方面,也要积极利用互联网公司的大数据,可以联合科研院所和企业大数据机构协同进行大数据研究,助力疫情防控、应急管理和社会的精细化治理,为决策提供有益参考。”沈浩表示。(完)