题目
|
基于Python的疫情数据可视化分析平台设计与研究
|
1.选题依据、国内外研究概况
选题依据
随着新冠病毒肺炎疫情的爆发给面临复杂外部环境挑战的中国经济带来极大外部冲击。疫情的高度传染性和不确定性对宏观经济领域总需求和总供给层面均造成不同程度的直接损失,给经济长期发展带来间接负面影响,对个人而言,不仅打乱了正常的生活,还要随时警惕病毒的蔓延,带来无尽的恐慌。由于不能及时整体或部分观测疫情形势与变化,导致一系列政策与防控措施无法实行,导致了疫情的进一步肆虐。为此,我的毕业设计就是针对新冠肺炎疫情进行数据的采集,并进行疫情数据的可视化与分析。
国内外研究概况
北京大数医达为南京市疾控中心建设的疾病与监测预警系统便直接打通了当地医院的电子病历系统(EMR)。这一疾控监测预警系统运用了大数医达最先进的大数据和人工智能技术,直接打通并连接到医院的EMR,作为省市疾控中心的上报分析、数据汇总及预警分析系统。系统结合历史疾控数据进行学习,并结合区域密度和人口流动率等大数据,可以对疑似数据对传染病的发展速度及分布区域等进行预测,从而为疾控决策给出参考依据。
在长沙双数科技的传染病疾病智能监测解决方案中,首先汇集EMR、实验室信息管理系统(LIS)、医学影像存档和通讯系统(PACS)及医院信息系统(HIS)四大系统诊疗数据,再运用双数传染病专家知识库、语义分析技术,对诊疗数据进行传染病疾病相关特征提取、标记。使用分析模型对特征进行分析比对,一旦认知到传染病病例,系统即时推送或延迟推送到具体医生电脑前端。
在医疗数据方面,比如美国的电子健康记录系统(Electronic health records,EHRS),
英国斥巨资建设全国一体化医疗照护信息储存和服务系统,新冠疫情爆发后,波士顿儿童医院的自动健康地图系统就发布了中国境外首次有关这种新型冠状病毒的公共警报。英联邦科学与工业组织使用贝叶斯推理开发出了Data61模型,可以综合判断多种人员流动信息,从而预测可能发生疫情的时间和地点。
|
2.主要研究(设计)内容、研究(设计)方法及技术路线
研究内容:本课题的研究主要针对疫情数据的可视化与分析预测。采用Python编写爬虫程序抓取疫情数据,爬取疫情的确诊人数、累计确诊、疑似确诊、治愈人数等信息,结合Python的多个库(pandas、json、request、re等),使用Numpy系统存储和处理大型数据,运用神经网络算法对疫情数据进行预测分析,最后采用echarts开源显示库进行数据的可视化,通过动态图、折线图等展示疫情统计信息,实时查看疫情动态,对疫情走向进行预测。
研究方法:利用Python中的pandas数据分析包进行数据清洗与处理,使用echarts进行数据的可视化与分析,神经网络算法进行预测。
技术路线:
|
3.本课题的重点、难点,预期结果和成果形式
重点、难点:数据可视化展示、RUN神经网络预测分析
预期结果:疫情数据饼图、柱状图、动态区域地图,疫情预测分析折线图。
成果形式:设计疫情数据可视化与分析系统,并撰写毕业论文。
|
4.进度安排
2022.12.01-2023.02.01:查询资料后完成选题。
2023.02.02-2023.3.01:构思具体方案,配置相关软件环境,完成开题报告。
2023.3.02-2023.4.01:编写毕业设计,完成中期报告。
2023.4.02-2023.5.30:完成毕业设计,撰写、提交毕业论文,准备答辩。
学生(签名):姬世龙 2023年3月1日
|
5.指导教师意见
该生在查阅大量国内外文献后,明确的选题意义,确定了设计的内容及方法,同意开题。
指导教师: 2023年3月6日
|
6.教研室(系)意见
同意开题。
主任: 2023年3月7日
|
注:题目类型:A-结合实际生产项目、B-结合教师科研课题、C-结合学生科技创新项目、D-结合学科竞赛;E-其他。