题目《基于weka的多标签文本分类系统的实现与研究》
一.需要一个文本分类界面,界面可以参考weka做,但肯定不能一模一样。-----》参考weka
二.在界面中包含3个功能块(最好有3个功能面板):
1.预处理功能,可以直接使用在weka自带的数据实现预处理。-----------------》参考weka
2.分类功能: ------------》参考mulan
因为weka只能实现单标签分类,所以要在mulan中调用
BinaryRelevance和BinaryRelevanceTransformation函数(在mulan的API查看)
实现将weka的单标签分类变成多标签形式,实现mulan库中的J48算法和最近邻分类算法。
用交叉验证法做十次分类实验,对准确率取平均值。
3.可视化:显示5个以上的可视化分析评估:-------------------------------》参考weka
(1)hamming-loss
(2)one-error
(3)ranking-loss
(4)average-precision
(5)coverage
重点在实现一个界面,其他的都有现成的代码。
完成系统即可,毕业论文本人自己撰写。
另外我需要一些技术文档,解释代码和指导我如何操作,让我能答辩时候通过。