4.1课题任务
基于主流预约挂号平台(医事通、医联网)采集数据,将采集数据储存于大数据平台,构建Elasticsearch的全文检索功能和预约挂号平台,提出研究与设计过程中所面临的问题及关键技术。
4.2重点内容
(1)面向重庆市各大医院网站的疾病、医生信息爬取、数据预处理及数据存储。
(2)基于大数据平台技术的数据仓库构建。
(3)使用Elasticsearch搜索引擎检索疾病、医生、医院信息。
(4)使用Django等Web框架实现挂号预约等功能开发。
4.3研究方法
(1)功能分析法
主要通过对市面存在的几款预约平台的功能进行分析,以患者、管理员的角度进行不同功能的分析。
(2)文献研究法
主要通过对文献的阅读,了解国内预约挂号平台的相关技术,为课题研究方向提供保障。
(3)个案研究法
主要通过对患者问题调查,将问题通过平台架构以及功能实现上得到解决。
4.4实现途径
首先对所需要的数据进行采集,存入构建的数据仓库中,使用Elasticsearch对数据建立索引,将数据存入到Elasticsearch引擎中实现海量数据的全文检索功能,再对系统的注册登陆、增删改查功能的开发。
(1)医生、医院、疾病数据采集
使用Scrapy框架从医事通挂号预约平台爬取医生姓名、职称、科室、擅长领域等数据,医院名称、等级等数据,再从疾病百科官网爬取疾病的名称、别名、特征、介绍、传染性、感染人群、就诊科室、恢复周期、治愈率等数据。将爬取数据存入Hadoop大数据平台中。
(2)数据仓库构建
Hive是一个构建于Hadoop顶层的数据仓库工具,支持大规模数据存储、分析,具有很好的扩展性。本项目主要是通过预约挂号平台,将预约信息、患者信息、医生信息实时导入到建立的Hive数据仓库中,通过进一步清洗处理数据,将数据规范化,方便后期进行数据可视化展示。
(3)Elasticsearch引擎构建
Elasticsearch是实时的分布式存储、搜索、分析的引擎。通过使用Django的Elasticsearch库和Haystack以及Docker进行搭建,使用Docker搭建服务端,通过Django引擎进行连接,将数据仓库中的数据建立索引传递至引擎,再从引擎取出数据,患者通过输入病情的关键词,实现对医生和医院的精确定位。
(4)系统功能设计与实现
Web系统包括如下功能:
①注册:登记用户昵称、手机号等必备信息。
②登录:密码登录或手机短信。
管理员角色:
③挂号查询:查看患者门诊挂号的具体信息,包括患者、医院、医生、就诊时段、挂号费用等。
④用户管理:该页面可以对医生、患者账号进行管理。
信息通知:可以填写入信息,患者通过在首页通知栏可进行查看。
⑤号源管理:管理医院、医生、就诊时段以及挂号费用。
⑥数据分析:预约人数折线图、科室预约饼状图、挂号预约前10医院等。
患者角色:
⑦疾病查询:通过疾病名称、症状等条件快速匹配医院信息,医生信息。
⑧预约挂号:患者选择医院、就诊医生,就诊日期以及时段完成预约挂号。
⑨退号:患者预约挂号后就诊前,对已预约挂号进行退号操作。
⑩个人信息管理:修改个人信息、密码等。
4.5本课题的进度时间安排
① 2022.11.09-2022.12.11:完成毕业设计开题。
② 2022.12.12-2022.12.19:完成医生、疾病数据爬取与处理工作。
③ 2023.12.20-2022.12.27:完成数据仓库构建与开发工作。
④ 2022.12.28-2023.02.12:完成数据分析与数据可视化功能的设计与开发。
⑤ 2023.02.13-2023.03.12:完成毕业设计(论文)报告初稿撰写。
⑥ 2023.03.13-2023.03.26:中期检查。
⑦ 2023.03.27-2023.04.16:毕业设计(论文)定稿和查重。
⑧ 2023.04.17-2023.05.05:毕业设计(论文)评阅。
⑨ 2023.05.06-2023.05.28:毕业设计(论文)答辩。
|