最近一段时间肺炎疫情受到人们的普遍关注,各种新闻铺天盖地而来,其中最受人关注的就是肺炎疫情的实时数据。
但是这些数据都只有最新的时间,没有历史数据,不方便分析肺炎疫情发展的动态过程,因此未明君写了个爬虫程序,将每天的数据保存下来,方便日后做分析研究。
目标网址
https://3g.dxy.cn/newh5/view/pneumonia?scene=2&clicktime=1579582238&enterid=1579582238&from=timeline&isappinstalled=0
目标数据
输入代码
导入模块
发送请求,获取信息
解析数据,提取数据
保存数据
简要分析
1月26日的数据可以看出,武汉作为疫情的源头,情况尤为严重,确诊人数排在前10的省级单位如下:
如果想要数据可以持续自动采集,我们只需要设置1个简单的循环,每隔24小时采集一次数据,或者每隔1小时采集一次数据,把代码放在一台电脑上持续运行,就可以将数据都保存下来作分析使用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.