目 录
一、 项目需求分析 - 1 -
1.1项目介绍 - 1 -
1.2功能需求 - 1 -
二、 项目分析与设计 - 2 -
2.1本项目需解决的关键技术问题 - 2 -
2.2项目流程 - 3 -
2.3功能模块 - 4 -
三、 项目设计与实现 - 5 -
3.1项目设计 - 5 -
3.1.1数据获取: - 5 -
3.1.2神经网络: - 6 -
3.1.3传播模型 - 7 -
3.1.4基于SEIR的预测 - 9 -
3.2项目实现 - 10 -
3.2.1数据可视化 - 10 -
3.2.2神经网络预测模拟 - 13 -
3.2.3各类模型基本实现 - 16 -
3.2.4基于SEIR的预测 - 18 -
3.2.5 人群模型 - 19 -
四、 设计日志 - 21 -
4.1数据提取与表格重构 - 21 -
4.1.1国内json数据结构分析 - 21 -
4.1.2国内与省市级数据显示 - 22 -
4.1.3美国及世界各国json数据结构分析 - 24 -
4.2定制可视化地图 - 26 -
4.3SEIR算法改进 - 28 -
五、 个人小结 - 29 -
六、 参考文献 - 33 -
一、项目需求分析
1.1项目介绍
自从2019年年末开始,到现在此项目完成时,新型冠状病毒(COVID-19)始终是一个社会生活中的热点话题,从国内到国外,从过去到现在,这场与病毒的战斗仍在持续。从潜伏人数到确诊人数,从死亡率到治愈率,从爆发点到增长拐点,从一国到世界……每一个名词所跟随的一个个阿拉伯数字构成了贯穿在这场战役中的一条条数据,而这一条条的数据又无时不刻牵动着人们的心弦,这些数据所代表的意义不凡,从无形的数据中抽象出清晰明了的逻辑线索,将一维的线性数据升维到二维的可视,表现规律,再从规律中拟合模型,推测未来的走势与发展,这样的工作正好是数据挖掘与分析的专长领域。
在本项目中,我将利用从多个官方可信网站公布的数据提取数据集,整合重构数据后,进行数据的可视化,以便清晰的分析疫情形势;再通过神经网络进行机器学习,对数据学习分析后配合SEIR传播模型,对疫情进行模拟与预测。
1.2功能需求
1.疫情数据的提取与清洗处理,重构后生成数据集;
2.导入合适的可视化方法库,将数据带入后进行数据多层可视化;
3.将数据集分为训练集与测试集,构造神经网络进行机械学习;
4.利用SEIR模型,合理设置各项参数,进行预测;
5.将模型与学习结果结合后,导入人群模拟演示。