目录
一、引言 1
二、关键技术方案 1
2.1 随机森林 1
2.2 经纬度转化 2
2.3 聚类 2
[简要介绍本项工作涉及的关键技术方案] 2
三、实验 4
4.1 数据 4
4.2 实验环境 5
4.3 实验步骤 5
一.事故严重程度 5
五、结果与讨论 8
5.1 结果 8
5.2 讨论 10
六、总结 10
参考文献: 11
一、引言
针对交通事故频繁发送的今天需要分析下交通事故发送的原因和造成损失的因素等等。
二、关键技术方案
[介绍采用的关键技术方法、原理、机理、算法、模型等。]
2.1 随机森林
利用随机森林可以对数据处理有好的结果,因为是一个多分类器的模型,所以无论是拟合效果和最后的结果还是都不错的。
随机森林就和他的名字一样,是一个森林一样的,我了解到的一种是他会建立很多的决策树分类器来做分类。然后在最后汇总效果好的。他会分袋内数据和带外数据。它会随机提取一些属性和一些数据,进行决策树的建立,然后在对建立的结果。
在随机森林中某个特征X的重要性的计算方法如下:
(1)对于随机森林中的每一颗决策树,使用相应的OOB(袋外)数据计算它的袋外数据误差,记为errOOB1。
(2)随机地对袋外数据所有样本的特征X加入噪声干扰(就可以随机的改变样本在特征X处的值),再次计算它的袋外数据误差,记为errOOB2。
(3)假设随机森林中有Ntree颗树,那么对于特征X的重要性 = ∑