1、要求
互联网技术、云计算技术及信息技术等的发展和应用,极大促进各行业的快速发展。随之而来的是庞大的信息数据处理工程,而怎样在如此庞大数据当中筛选、提取及分类真正有价值的数据,成为当前各大行业所需面临的主要问题。每天互联网产生的数据,就以 PB记,据统计,每天互联网产生的数据可以刻满 1.68 亿张DVD。海量的数据里面蕴含得‘黄金’是超乎想象的,可是怎么挖掘出这些‘黄金’呢,数据挖掘应运而生。
数据挖掘吸纳了诸如统计学、机器学习、模式识别、数据库和数据仓库,信息检索,可视化,算法,高性能计算和许多应用领域的大量技术。目前数据挖掘在各行各业应用广泛,尤其在金融、保险、电子商务和电信方面得到了很好的效果。例如金融公司、银行的分析场景,帮助跟踪与信用卡、网络银行或任何其他银行服务相关的,可疑活动、违法或欺诈性交易。在医疗领域,利用数据挖掘,可以有效地跟踪和监测患者的健康状况,并帮助基于过去的疾病记录进行有效的诊断。还被用于索赔及其分析,例如用于识别多次索赔的医疗险。
功能要求:
请结合已学的数据挖掘和分析知识,实现某一个领域内的具体应用。要求合理分析该领域的背景内容,精准分析挖掘目标。选择合适的数据挖掘算法模型解决对应的问题。并对模型应用结果进行评价,为模型的应用方提供合理的决策建议。
技术要求:
(1)熟练运用数据挖掘平台Pycharm、Anaconda等工具,以及第三方库;
(2)合理使用分类与预测、聚类分析、关联规则、时序模式、智能推荐、文本分析、机器学习等等方法。选用正确的算法模型解决问题。
2、文档说明
(1)文档封皮
文档名称
姓 名 :组长 名字学号
组员1 名字学号
组员2 名字学号
班 级:
学 期:
成 绩:
(2)正文提纲
1、介绍拟解决的问题背景和挖掘目标
2、数据挖掘思路
3、数据挖掘实现过程(流程图、代码、效果图、文字说明,模型评价)
4、总结
3、提交方式
创建一个文件夹,命名为“学号+姓名”,文件夹中应包含如下内容:作品文件(源代码文件、数据、图表)、作品文档、答辩PPT。
数据挖掘与分析课程设计
XX空气污染数据挖掘分析
姓 名 :组长 名字学号
组员1 名字学号
组员2 名字学号
。。。。。
班 级:
学 期:
成 绩:
目录(采用自动生成目录)
第一章.。。。。。1
第二章.。。。。。3
。。。。
总结
XX空气污染数据挖掘分析
摘要:。。。。。200字内
关键词:。。;。。。;(3-5个关键词)
第一章.。。。
内容
第二章.。。。
内容
第三章.。。。
内容
。。。
总结
内容