目 录
一、 背景 1
二、 目的 2
三、 原理 2
1、 数据分析三步骤 2
a) 数据预处理(数据清洗) 2
b) 构建模型 3
c) 数据可视化 3
2、 决策树原理 3
a) 决策树构建三步骤 3
b) 算法的对比及选择 4
c) 决策树算法流程图 5
四、 实验环境 5
五、 实验方法及步骤 5
1、 数据预处理 6
2、 构建模型 6
a) 数据集划分 6
b) 调参 7
c) 根据调好的测试构建模型 8
3、 可视化 9
六、 实验结果及分析 10
七、 总结与展望 10
八、 参考文献 11
一、背景
近年来,受学习理论发展和技术进步的影响,学习环境已经开始从线下转移到线上。尤其像今年这种情形,一些不可抗拒的外界因素,使得学校不得部在线教学,这让学生和教学工作者切身体会了线上教学的便利和优点,同时也找到了克服其缺陷的办法。因此,即使这场灾难过去后,线上教学也将紧密的与线下教学的模式相结合在一起。学生在网上学习将产生大量的学习行为数据,这些数据无论是对于学生还是教育工作者来说,都是一个巨大的“宝藏”。
通过机器学习算法进行数据分析,无疑是对这个“宝藏”最佳的开采方式。利用学生在网上的学习行为数据,感受学生的学习状态,预测学生的课程成绩。虽然学生是学习的主体,但是在学习过程中,难免会有过度自信或过分自卑的情况,学习行为数据没有任何感情的掺杂,可以给出一个理性、合理的评测。教师也可以根据预测情况,对学生个性化教学,因材施教,提交学生成绩。毫无疑问,对学习行为数据的分析是一个必然趋势趋势,是势在必行的。
本设计基于决策树算法从多角度对某学校网上平台的学生行为数据进行分析,将根据学生的综合成绩将学生划分为三类:优秀(80分 – 100分)、良好(60分 – 79)、差(0分 – 59分)。这些数据包括到课率、预习率、习题正确率、综合成绩,数据量达千余条。通过已有数据建立决策树模型,供该平台未来的使用者进行预测,起到教学预警的作用。