2022-12-26
数据分析
00

新冠疫情持续三年,现在新政策新形势,终归会回到正常的生活秩序。12 月 7 日,国家卫健委官网发布防疫政策「新十条」,要求精准防控,不得采取任何形式临时封控。12 月 8 日,仙城(xi'an cheng)跟进新政策,大部分管控的小区开始开放。记得那天去地铁站,下意识拿出手机准备扫健康码,发现二维码牌子已经撤了。

新政策下官方不再组织统一测核酸,能查到的仙城感染数据截至 12 月 13 日。没有数据不意味着没人感染。反倒由于人员流动比 12 月 7 日前更自由,以及欧米克融毒株的高传播性,周围人感染比例越来越高。最近一周,全公司的人基本上都居家养病,只有我们少数几个人轮流值班。虽然进出公共场所不再查核酸扫健康码,但出门还是要小心翼翼,不敢往人多地方去。要恢复到无顾忌地逛街吃饭 KTV,还是要等这一波疫情过去,等大部分人变杨康。

按照今年之前北京、上海的疫情,新增感染人数会呈现先增后减的趋势,新增感染数降下来,治愈数慢慢增加,最后疫情平息。但现在没有感染人数的数据,无法直接观察仙城本轮疫情走势,只能靠其他办法粗略估计。

之前看到一片文章,说到百度指数与新增感染数正相关,就找来仙城的数据试着分析。

  • 感染人数来源: 全国新型肺炎疫情实时数据接口 ,这个项目的数据来源为丁香圆,将各地发布的疫情数据收集整理。对于城市级别,能得到每日累积感染人数,需算出每日新增感染人数。
  • 百度指数: 百度指数 ,搜索关键词为「发烧+新冠」。百度指数不提供数据下载,要借用一个浏览器插件把数据爬下来: 下载百度指数

待分析的数据时间跨度为 2021 年 1 月 1 日至 2022 年 12 月 13 日,再往后就没有可靠的疫情数据。因为感染人数和百度指数不在一个数量级,所以对两组数据分别做归一化,不影响变化趋势的呈现。

绘制折线图如下。

Pasted image 20221226162042.png

从图中能看出,对于仙城:

  1. 新增确诊数和百度指数(关键词「发烧+新冠」)之间并不存在很稳定的正相关性:2021 年 10 月之前新增确诊数基本为零,但百度指数却很高;2021 年 12 月中至 2022 年 1 月中,是仙城继 2020 年初后疫情最严重一次,但百度指数却不是最大峰值。
  2. 新增确诊数和百度指数在 2022 年出现峰值的日期接近:2022 年 3 月、7 月、11 月都出现一波疫情,百度指数也立马增长。
  3. 2022 年的几波疫情,百度指数出现峰值后回落到锋前值的时候,新增确诊数也早已回落。

综上可推断:通过百度指数(关键词「发烧+新冠」)推测确诊人数不靠谱,但能观察出每一波疫情最严重和消退的大概时间。

这个推断也可能对现在没效,原因在于,以上历史数据是在有防疫管控下产生的,确诊的人会被防疫部门安排治疗,不需要自己搜索怎么吃药,会进行搜索的是那些怀疑自己感染的人。而现在没有统一的防疫管控,个人是自己健康的第一责任人,相关搜索量必然增加。再加上管控相当于人为降低了病毒的基本传染数 R0,与没有管控又是不同的情况。

如果要避免防疫管控对数据造成的影响,还是需要分析国外或香港这些提前开放地区的数据。

假如以上推断成立,观察百度指数(关键词「发烧+新冠」)最近几天的走势,仙城这波疫情最严重时候已过,新增确诊数峰值大概出现在 12 月 17 日前后,目前正在回落。

Pasted image 20221226173041.png

另一个可能估计疫情趋势的数据是地铁客流量。下图是仙城近 15 日客流量(数据来源: 西安地铁信息概览 )。最近两周迎接放开后第一波冲击,地铁日客流量持续走低,说明被感染的人在不断增多,都在家呆着。从上周五(12月23)坐地铁的人开始回多,上周六、周天的客流量甚至超过周中,平日周末两天会比周中地铁人少,说明敢出门和能出门的人在变多。

Pasted image 20221226203522.png

从百度指数和地铁客流量走势,结合 7 天的平均康复时间,推测仙城每日新增确诊数已经在降低,总感染人数大概也到了最大值,目前随着痊愈的人增多,感染人数会逐渐回落直至本轮疫情消退。

本文作者:tsingk

本文链接:

版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!