课题名称
|
基于大数据的学生网络学习行为分析及可视化
|
课题来源
|
教师拟定
|
课题类型
|
A
|
指导教师
|
|
学生姓名
|
|
学 号
|
|
专 业
|
|
开题报告内容:(调研资料的准备,设计的目的、要求、思路与预期成果;任务完成的阶段内容及时间安排;完成设计(论文)所具备的条件因素等。)
一、调研资料的准备
调查收集网络上的学生学习产生的行为信息,熟悉网络爬虫流程,掌握数据分析算法,了解基本统计图使用以及其所表示的含义。
二、设计的目的、要求、思路与预期成果
(1)设计目的:通过收集当下的学生学习行为产生的信息数据,对学生学习行为进行分析,形成可视化的界面展示。
(2)要求:利用爬虫框架对线上学生学习行为数据进行爬取,例如可以来自慕课,学习通等网站。经清洗处理之后,分析学生网络学习行为关键因素,并根据这些因素,使用聚类等算法建立学生网络学习行为分析模型,实现对学生网络学习行为的分析。最后,将整个分析过程进行可视化。
(3)思路与预期成果:采用Python中PySpider框架获取数据,并将信息数据存入到MySQL数据库中;对无关数据、重复数据,平滑噪声数据等无关的数据进行删除;使用聚类等算法建立学生网络学习行为分析模型,实现对学生网络学习行为的分析;同时借助Java开发一个可视化展示平台,可以与数据库MySQL相连从而进行数据库的操作,根据导入的数据集可以制作数据图表,柱状图、饼图等图表。
三、任务完成的阶段内容及时间安排
第9-13周:领取任务书,根据任务要求,查阅文献,收集资料,进行课题需求分析,完成开题报告和文献综述;第14-16周:爬取房价数据,进行数据预处理,对属性进行可视化,分析户型、地理位置等信息,以及不同因素对房价的影响情况;第17-下学期第1周:根据预测问题,选取多种模型并进行训练,完成中期自查表;第2-3周:确定合理指标评估模型,选择最优的模型实现房价的预测,并搭建可视化系统,集成展示分析结果;第4-6周:根据课题工作内容,完成毕业论文的撰写;第7-8周:成果验收,论文定稿,准备学生论文答辩工作。
四、完成设计(论文)所具备的条件因素
熟练掌握Python语言,会使用网络爬虫、数据库,熟悉聚类等算法。
指导教师签名: 日期: 2022年11月18日
|
注:课题来源要填写明确(如教师课题、教师拟定、学生建议、某企事业单位项目等)
课题类别:A—毕业设计;B—毕业论文;C—社会调查报告;D—作品展示
E—毕业汇报演出;F—其他