基于循环神经网络模型(GRU)的新型冠状病毒肺炎流行趋势预测
目录
基于循环神经网络模型(GRU)的新型冠状病毒肺炎流行趋势预测 1
1、Background 3
1.1 研究传染病的重要意义 3
1.2 研究传染病流行趋势的传统动力学方法 3
1.3 新型冠状病毒疫情背景 5
1.4 目前预测新冠病毒疫情的已有研究 5
2、Our Method 7
2.1 数据来源 7
2.2 模型假定 8
2.2 模型简介 9
2.3 模型构建 13
2.2 数据输入 21
2.4 敏感性分析 26
3 总结与思考 29
参考文献: 29
背景:流行病一直是人类生存发展的大敌,目前新冠疫情在中国得到了很好的控制,但在国外感染人数却仍然不断上升,如果世界各国不采取必要的应对措施,则极有可能在全球造成灾难性后果。由于新冠疫情的爆发对世界产生了全面而深刻的影响,所以借助数学手段对其流行趋势进行定量预测具有重要意义。目前许多研究已经预测了新冠疫情的流行趋势,但大多数研究局限于传统的流行病动力学数据,采用的是传统的微分模型。而本研究认为, 只有考虑社会因素、地区环境和政府政策和疫情传播的相互作用,才能得到更好的模型。
方法:本研究根据 2020 年 1 月 11 日至 2020 年 5 月 27 日的全球数据,将基于循环神经网络的机器学习时间序列预测和传统的传染病动力学模型结合起来,建立了新冠疫情的日累计确诊病例(cumulative confirmed cases,
CCCs)、新发病例(new cases,NCs)、新增死亡病例(new death cases,NDCs)和累计死亡病例(cumulative death
cases,CDCs)预测模型。模型不但包含 CCCs、NCs 等传统流行病模型参数,还引入了诸如地区 GDP 、居民健康开支(Current-health-expenditure,CHE)占 GDP 比例和人均预期寿命(Life Expectancy)等社会因素和地区年平均温度、空气污染变化幅度等环境因素以提升模型的精度,同时也克服了传统模型需要分地区建模的缺点,实现了全球各地区统一建模,从而更具普适性。基于这些模型,我们预测了新冠肺炎疫情在阿富汗、巴西、印度、美国、芬兰 和的南非流行趋势。
结果:通过对比五个国家的过去 20 天新增病例历史值和模型预测值验证模型准确性,给出 216 个国家的未来
20 天新增病例预测值,并展示分析了其中的六个典型国家。同时,对于模型的敏感性分析表明,新冠病毒在 5 - 15 ℃ 的温度下最易传播,地区流行风险和当地空气中 NOx 的含量呈显著的正相关,原因初步分析为 NOx 含量与地区人类交通活动强度呈正相关。其他和疫情严重程度显著相关的因素有:CHE (健康开支所占 GDP 比重)、GDP (国民生产总值) 增速、工业产值占 GDP 比重、地区年平均温度;而相较之下影响不显著的因素有:成人死亡率、麻疹免疫率、人均寿命、人口密度和人口总数。
结论:新冠肺炎的流行趋势不是一个简单的生物学问题,而是深刻地受到了社会因素和环境因素的影响。各地 区环境不同,因而新冠肺炎的流行快慢也会受到影响,本模型并没有考虑病毒变异、社会动荡等更加不可预见的因 素然而现实和模型均表明,无论新冠疫情如何发展,采取全面而严格的控制措施才是应对疫情的不二良方。
关键词:新冠疫情;预测;流行病学模型;SEIR 模型;机器学习;循环神经网络;GRU