1.目标及基本要求
(1)目标
在毕业设计(论文)规定的时间内,通过完成毕业设计项目和相关文档的编写,从而培养具有较强的创新意识、技术实践能力和工程应用能力,能适应软件领域的数据采集、数据清洗、数据存储、数据分析、数据建模、系统设计、实现、测试、实施等岗位的需要。
(2)基本要求
毕业设计报告遵照重庆工程学院《本科设计(论文)撰写规范与范本》完成,正文不少于12000字。
毕业设计项目开发过程规范、标准,毕业设计应包含如下过程。
①项目前期阶段
根据所选课题查找相关资料,并确定数据来源。
②数据采集阶段
利用各种数据采集工具,编辑爬虫对数据信息进行爬取获得。
③数据清洗阶段
对所采集的大量数据进行对应方式的处理,确保数据的完整性、唯一性、权威性、合法性、一致性。
④数据分析阶段
对数据进行提取,寻找合适的模型对其进行建模和训练。
⑤数据展示阶段
搭建网站并使用可视化工具把数据分析的结果进行展示。
⑥总结
总结毕业设计项目的经验和教训。
2.主要任务
(1)调研并了解课题背景,分析具体需求,编写开题报告。
近年来随着我国经济的高速发展,以及人民生活水平的日益提高,有效的促进了我国各个行业的迅速发展。但行业高速发展的同时,也给许多的行业带来的激烈的市场竞争。在激烈市场竞争中,一个企业要生存下去,就必须得到工商行政许可,使其企业能顺利的走下去。
当前我国许多地区的工商行政许可管理水平仍然处于落后水平,在信息化背景下各个地区的工商行政许可管理仍然采用传统的人工管理方式,这种方式存在着诸多的不足。企业的一些数据均采用传统的纸质等方式进行存储,无法对相关经营数据进行科学的统计分析,无法为工商行政许可管理者决策提供相应的信息支持。因此,各地区行政部门必须建立符合自身地区工商行政许可的聚合以及查询系统来辅助行政部门进行经营管理。本系统的开发正是基于各地区对工商行政许可信息化的迫切需求,提出了本系统开发项目。
(2)按照软件工程开发规范进行课题的设计、实现、测试和部署发布,编写对应的设计和测试文档、创建课题的运行环境,完成课题所需的数据库创建和源代码编写。
工商行政许可信息爬取及展示系统主要管理对象为用户、管理员,通过管理员的集中管理实现工商行政许可信息的管理和存储处理,通过用户查看可能感兴趣的工商行政许可信息。
① 信息获取
管理员定期利用爬虫技术在企查查对工商行政许可信息进行爬取。
② 数据存储与清洗
将获取的数据存储进数据库,并进行缺失值,异常值处理,将清洗过后的数据储存进数据库。
③ 搭建网站
搭建网站框架,用户可在网站查询某家企业的工商行政许可信息,如法定代表人,注册资本,统一社会信用代码,纳税人识别号,企业类型,人员规模,曾用名,企业地址,经营范围,经营状态,实缴资本,组织机构代码,进出口企业代码,营业期限,参保人数,英文名,成立日期,核准日期,工商注册号,所属行业,登记机关,所属地区等。并采用图形化的方法展示部分获取的信息。
(3)根据(1)(2)的内容完成毕业设计报告。
3.成果形式
(1)开题报告;
(2)毕业设计(作品):相关文档(需求说明书、设计规格说明书、测试报告等),作品源代码(电子文件);
(3)毕业设计报告;
(4)答辩PPT及项目演示视频。
|
[1]周培源.大数据舆情研究的现状与进路:基于文献计量分析的思考[J/OL].情报杂志:1-6[2019-11-13].http://kns.cnki.net/kcms/detail/61.1167.G3.20191113.1446.003.html.
[2]陈红琳,张玮.基于图谱分析的大数据研究热点与趋势[J/OL].荆楚理工学院学报:1-10[2019-11-13].https://doi.org/10.14151/j.cnki.jclgxyxb.20191113.001.
[3]黔西南民族职业技术学院 王丽 罗胜. 有效发挥大数据联动性引擎作用[N]. 贵州
日报,2019-11-13(010).
[4] 胡艳玲. 大数据联盟数据聚合服务模式研究[D].哈尔滨理工大学,2019.
[5] 耿昭阳. 大数据清洗算法研究与系统平台搭建[D].吉林大学,2019.
[6] 齐文,鲍玉斌,宋杰.基于列存储的大数据采样查询处理[J/OL].计算机科学:1-9[2019-11-13].http://kns.cnki.net/kcms/detail/50.1075.tp.20190816.1647.051.html.
[7] 马志程,袁海峰,谷洋,刘亚茹,张孝.文档-关系数据查询执行技术研究与实现[J/OL].计算机科学与探索:1-14[2019-11-13].
[8] 谢亚妮,李响,黄兆坤,钟鸣,雷鸣涛.一种基于Key/Value数据库的查询方法[J].信息化研究,2019,45(03):58-63.
[9] 宋俊苏.大数据环境下基于NoSQL数据库的查询技术研究与应用[J].电脑编程技巧与维护,2019(02):76-77+116.
[10] 葛文帅. 业务导向的自定义大数据查询系统及其SQL解析器的设计与实现[D].北京邮电大学,2019.
[11] Taewoo Kim,Wenhai Li,Alexander Behm,Inci Cetindil,Rares Vernica,Vinayak Borkar,Michael J. Carey,Chen Li. Similarity query support in big data management systems[J]. Information Systems,2020,88.
|