目录
一、作业任务
二、 运行环境
三、算法介绍
四、程序分析
1. 制作数据集:
2. 输出决策树结果
3. 可视化决策树:
五、 界面截图与分析
1.通过图来大致观察一下不同属性的划分情况:
2.查看属性对于结果的划分影响:
3.程序运行控制台输出结果:
4.决策树可视化结果:
六、心得体会
七、参考资料
八、附录
代码
一、作业任务
1.编程实现ID3算法,针对下表数据,生成决策树。
ID
|
color
|
size
|
act
|
age
|
inflated
|
1
|
YELLOW
|
SMALL
|
STRETCH
|
ADULT
|
T
|
2
|
YELLOW
|
SMALL
|
STRETCH
|
CHILD
|
T
|
3
|
YELLOW
|
SMALL
|
DIP
|
CHILD
|
F
|
4
|
YELLOW
|
LARGE
|
STRETCH
|
ADULT
|
T
|
5
|
YELLOW
|
LARGE
|
DIP
|
ADULT
|
T
|
6
|
YELLOW
|
LARGE
|
DIP
|
CHILD
|
F
|
7
|
PURPLE
|
SMALL
|
STRETCH
|
CHILD
|
T
|
8
|
PURPLE
|
SMALL
|
DIP
|
ADULT
|
T
|
9
|
PURPLE
|
SMALL
|
DIP
|
CHILD
|
F
|
10
|
PURPLE
|
LARGE
|
STRETCH
|
CHILD
|
T
|
问题提示:可设计数据文件格式,如color属性取值YELLOW:0,PURPLE:1等,程序从指定数据文件中读取训练集数据。
问题拓展:要求将计算各属性信息增益过程及决策树生成过程演示出来。
二、运行环境
1. 编程语言:Python
2. 使用第三方库:Numpy,Matplotlib,Scikit-learn
3. IDE:PyCharm
4. 操作系统:WIndows10