《数据仓库与数据挖掘》课程设计任务书
题 目: 图书借阅数据挖掘分析
专 业: 数据科学与大数据技术 班级:2班
学 号: 21910204 姓名: 党君平 指导教师:支永坤/白旭光
一、课程设计目的
通过综合实践,使学生巩固数据库技术、数据结构、数据挖掘等知识,将理论与实际相结合,完成一个小型数据挖掘系统的设计与实现。在此基础上强化学生的实践意识,提高其实际动手能力和创新能力。
二、课程设计参数/内容/……
在这次图书借阅数据挖掘课程设计中,从数据管理、数据采集、数据预处理等方面来完成图书借阅课程设计。
采用关联规则中的Apriori算法对图书借阅事务集合进行数据挖掘。挖掘出的结果形如:数据库原理==> SQL Server 支持度2%,置信度 30%,或数据库原理、SQL Server==>Delphi 支持度0.5%,置信度 1%
结果显示与解释评估。把挖掘出的结果可视化,并对挖掘出的结果进行评价。
三、课程设计要求及工作量
1.进行数据采集、数据预处理、数据挖掘、解释评估等步骤的设计;
(1)数据采集:爬取图书馆图书借阅数据,形成事务集合。
(2)数据预处理:将采集到的数据转换为可进行数据挖掘的形式。
(3)数据挖掘:采用关联规则中的 Apriori 算法对图书借阅事务集合进行数据挖掘。
(4)结果显示与解释评估。把挖掘出的结果以一种直观的方式显示出来,并对挖掘出的结果 进行评价。
2.撰写出符合要求的软件项目综合实践报告。
(1)报告条例清晰合理
(2)报告中要有算法,公式、图
3.采用Python或R语言进行数据挖掘
四、课程设计进度安排
序号
|
课程设计内容
|
安排天数
|
1
|
查阅文献资料
|
0.5天
|
2
|
数据采集、预处理,形成事务集
|
0.5天
|
3
|
算法设计
|
1.5天
|
4
|
算法实现
|
2天
|
5
|
结果可视化
|
0.5天
|
6
|
报告撰写
|
2.5天
|
7
|
程序调试
|
1天
|
8
|
答辩
|
0.5天
|
五、注意事项
1.按时间进度表完成课程设计。
2.三人一组,合理分配,不得抄袭。
六、参考资料(列出不少于8-10篇参考资料)
[1]洪怡琳. 基于关联挖掘的图书借阅分析[J]. 2021.
[2]李冬云. 利用关联规则挖掘技术实现数字图书馆个性化推荐服务[J]. 兰台内外, 2020(34)
[3]余兵兵. 关联规则挖掘在图书销售系统设计中的使用[J]. 黑龙江科技信息, 2019.
[4]魏欣. 图书馆图书流通数据的关联规则挖掘[J]. 教育现代化, 2019, v.6(91):133-134.
[5]薛健. 基于数据挖掘技术的高校图书信息化管理研究[J]. 信息技术, 2019, 000(002):75-78,83.
[6]陈淑英, 徐剑英, 刘玉魏,等. 关联规则应用下的高校图书馆图书推荐服务[J]. 图书馆论坛, 2018, 38(2):6.
[7]赵雨薇. 基于数据挖掘感知读者需求的高校图书馆差异化服务研究[J]. 图书馆工作与研究, 2018, 000(007):68-73.
[8]李华群. 多维关联规则在图书馆借阅数据中应用分析[J]. 电脑知识与技术:学术版, 2021.
1
|
查阅文献资料
|
0.5天
|
2
|
数据采集、预处理,形成事务集
|
0.5天
|
3
|
算法设计
|
1.5天
|
4
|
算法实现
|
2天
|
5
|
结果可视化
|
0.5天
|
6
|
报告撰写
|
2.5天
|
7
|
程序调试
|
1天
|
8
|
答辩
|
0.5天
|