1.设计目的
通 过 综 合 运 用 Python 数 据 分 析 常 用 的 Numpy, Pandas,
Matplotlib 完成国内某高校学生的消费行为分析,为改进学校服务并为相关部门的决策提供信息支持。
通过本项目的实践,培养一定的科学研究能力,软件项目开发能力,科研文档撰写能力。
2. 设计要求
本项目提供国内某高校校园一卡通一个月的运行数据,使用数据分析和建模的方法,挖掘数据中所蕴含的信息,分析学生在校园内的学习生活行为,为改进学校服务并为相关部门的决策提供信息支持。
本设计任务分为两部分:
1、运用 Python 数据分析常用的 Numpy、pandas、Matplotlib 等对食堂就餐行为、学生消费行为进行处理、统计分析和可视化。
2、根据学生的消费行为对学生进行分类,最终得到不同特征的学生群体,并分析不同学生群体存在的特征。
3. 数据说明和任务描述
3.1 数据说明
data1 学生 ID 表
data2 消费记录表
3.2 任务描述
3.2.1 食堂就餐行为分析
1) 绘制各食堂就餐人次的占比饼图,分析学生早中晚餐的就餐地点是否有显著差别。
2) 通过食堂刷卡记录,分别绘制工作日和非工作日食堂就餐时间曲线图,分析食堂早中晚餐的就餐峰值。
3.2.2 学生消费行为分析
3) 根据学生的整体校园消费数据,计算本月人均刷卡频次和人均消费,分析不同专业间不同性别学生群体的消费特点。
4) 根据学生的整体校园消费行为,选择合适的特征,构建聚类模型, 分析每一类学生群体的消费特点,为学校判定学生的经济状况提供参考意见。
(采用 K-Means 算法根据学生的消费行为对学生进行分类,最终得到不同特征的学生群体,并分析不同学生群体存在的特征。)
4、参考资料
1. Pandas 中文网 hhttps://pypandas.cn/
2. numpy 中文 https://www.numpy.org.cn/
3. Sklearn 中文文档 :http://sklearn.apachecn.org/#/
5.开题报告以及课题进度
主要有 3 个重要时间节点: 首周结束提交开题报告, 课题结束提交毕业设计论文,中间提交一份中期报告。
根据课题的总体情况,分成若干个子任务,分别在相应的周次完成。
序
号
|
周次
|
起止日期
|
完成内容
|
提交日期和内
容
|
1
|
第 8 周
|
4.3~4.9
|
查阅资料、完成开题报告
|
4.9 提交开题报告
|
2
|
第 9~12 周
(共 4 周)
|
4.10~5.7
|
编写代码,完成项目功能
|
5.7 提交中期报告
|
3
|
第 13~14 周
(共 2 周)
|
5.8~5.21
|
编写代码,完成项目功能,撰写论文提交论文
|
5.21 提交论文
|
3
|
第 15 周
|
5.22~5.28
|
修改论文
|
5.28 论文定稿
|
开题报告:格式见:附件 04 毕业设计(论文)开题报告.doc 中期报告:报告课题完成情况,中期报告是毕业论文的重要基础
毕业论文:格式见:附件 03 毕业设计(论文)撰写相关要求.doc