一、背景
新型冠状病毒肺炎(COVID-19,简称“新冠肺炎”)疫情肆虐全球多个国家,2020年3月11日,世界卫生组织 (WHO) 正式宣布将新冠肺炎列为全球性大流行病。
在全国抗击新型冠状病毒疫情的过程中,产生了前所未有的大规模疫情数据,利用大数据分析技术和方法能监测疫情发展,从而更好地进行疫情防控工作。空间数据分析作为大数据分析的重要组成,将数据智能处理、直观展示和交互分析有机地结合,使机器智能和人类智慧深度融合、优势互补,为疫情防控中的分析、指挥和决策提供有效依据和指南。
二、目的
本项目希望能利用数据分析可视化大屏技术,能够更直观的感知和预测疫情发展趋势,有效节省决策时间,为专业人士提供更多便利。对于我们来说,也能让我们随时清晰的了解当下最新的疫情,了解当下趋势。
三、意义
后疫情时代,疫情数据仍是民众关注的重点,而随之涌现出的大量可视化图表、数据分析平台,及时地向公众传达着疫情的数量信息和时空分布及变化,能够帮助大众快速了解疫情当前状况、推断发展趋势。尤其是政府疾控应急指挥中心、医院应急指挥中心等更少不了疫情分析大屏。可快速将各类信息、图像数据、战略部署及现场疫情情况更可观呈现,为科学决策提供海量信息与精准数据,成为提升战疫行动效率的加速器。
使用了mysql数据库在处理当下疫情产生的海量数据可以快速储存和更新,核心代码使用python语言,python语言可以导入各种各样的库或模块,非常方便,编程格式也很简洁,可视化作业调用json、request、pyecharts、pymysql、pandas等众多好用的模块才可以轻松的实现。
四、解决方案
编写python爬虫核心代码,爬取我们官网的实时疫情数据,进行格式化。使用sql语言创建数据库数据表,利用python连接mysql数据库,将格式化的疫情数据存放到数据库。分析我们想要可视化的疫情数据,巧妙使用sql语言查询,再利用echarts图表技术展示人们看着更直观的图表大屏。
五、方法手段
1. 利用requests get和json字符串方法获取官网数据并转成字典,利用循环筛选出疫情重要的历史和当天数据。
2. 使用pymysql库连接和将数据存入mysql数据库,并利用循环字典、对比时间戳、使用execute方法插入数据库数据完成数据库的每日更新,达到数据的真实性。
3. 巧妙使用sql语言的sum方法、条件语句(where、group by、order by)查询我们想要可视化的数据。
4. 利用pyecharts库里面的Map(),Line(),WordCloud()方法分别制作地图,折线图,词云,再利用Page()方法把制作的图表布局,保存配置,最后生成我们理想的疫情可视化大屏。
5. 可视化作业在5.7版本的mysql数据库和装有3.8版本python解释器的2020版本的pycharm实现。
|