2022-04-29 2168

全国最新疫情数据爬取+可视化代码

作者:SPSSPRO

从今年上海疫情反扑到现在已经过去一个多月,什么时候能“清零”,什么时候能够解封回归到正常生活依然是未知。四月的尾声,我们仍然在与疫情战斗,大家被迫长期隔离在家,在生活质量受到影响的同时,更严重的是随之而来的各种负面讯息带来的心灵冲击。

 

 

上海本轮疫情中的 Omicron 新冠毒株,具有传播快、病情隐匿、临床症状轻、致死率低的特点。居高不下的感染人数、日益增长的死亡病例......上海疫情为何居高不下?中国著名流行病学家俞顺章教授表明,这次上海病例上升很快,主要原因是奥密克戎 BA.2 变种的强传染性(R0: 8~10),病毒传播的速度大大超过动态清零的速度。

 

 

 
 

截至4月25日,在上海累计五十多万感染中,累计死亡病例190例,最小33岁,很少的重症率和病死率,目前也没有直接死于新冠肺炎的病例,也反映出 BA.2 的流行特征。按照上海全面封闭的趋势来看,病毒在 3~4 个潜伏期内,感染应该会有适当控制,疫情曲线突发高峰后移。但通过最新数据我们可以发现,尽管近期确诊与无症状感染的人数都呈现明显的下降趋势,但是每日新增感染数还是维持在 2 万左右。

 

 

群体核酸采样过程中不规范的操作和暴露可能是重要原因。采样时人与人之间的距离太短,被采样时张大嘴巴吸气,病毒通过空气传播,如果前面一位是阳性的话,后面一位就可能被感染。志愿者们由于接触面广泛,并且没有接受过严格的消毒培训,感染率可能更高,从而成为可能的潜在传染源。上海在封锁前,市民疯狂进行采购,人员大面积聚集,口罩佩戴不规范。再加上多轮的核酸采样,变成了感染传播的加速器。这也是为什么上海郊区比城区疫情较轻的主要原因,低人口密度可以在群体核酸采样中减少暴露程度,减少传播系数。

 

 

 

 

所以大家在进行核酸采样时一定要做好个人防护,佩戴好医用口罩,排队保持1米以上间距,不要用手接触操作台上的物品,更不触碰采集人员的防护服!!

 

 

疫情数据是大家都很关心的数据,也是学者们都在使用的数据,百度、腾讯、网易、今日头条等多家互联网巨头每天都会根据国家卫健委官网发布的疫情最新情况进行数据的实时更新。很多人苦恼pycharm安装麻烦,Python爬虫数据分析从入门到放弃。

 

 

SPSSPRO最新上线的编程版不仅可以实现python的全部功能,还有现成的常用代码模板,用户只需要更改参数就可以实现,对编程小白十分友好,并且只需要下载客户端检查更新到最新版本就可以实现。

 

 

下面我们通过notebook爬取百度疫情最新数据并对数据进行可视化操作。

 

 

1.数据爬取

 

 

 

 

我们爬取‘疫情实时大数据报告’中的省份信息、确诊人数、死亡人数、治愈人数,并绘制地图。爬取下来的数据如下图所示,是大家常用的面板数据格式。数据包含了全国34个省级行政区的确诊人数、死亡人数、治愈人数。

 

 

 

 

2.数据可视化

 

 

 

代码运行成功后,系统会自动在代码所在的文件夹下生成对应的文本,点击信任HTML后,就可以看到全国疫情的地图绘制完成了。

 

 

需要这份代码的朋友,可以在spsspro社区领取!

 

 


 

 

SPSSPRO:https://www.spsspro.com/

免费在线、简单易操作的数据分析平台

还有更多好玩、有趣、实用的功能等你发现!

(点击链接,直达官网)