一、毕业设计(论文)的主要内容及要求
1、开题报告和文献阅读
(1)文献阅读:查阅文献应不少于15篇,其中外文文献不少于2篇,近5年内的文献数一般不少于文献总数的1/3,并应有近2年内的文献。
(2)文献综述:3000字以上,包括国内外现状、研究方向、进展情况、存在问题、参考依据等。
(3)开题报告:2000字以上,包括选题的意义、可行性分析、研究的内容、研究方法、拟解决的关键问题、预期结果、研究进度计划等。
(4)外文翻译:3000字以上(翻译成中文后的汉字字数)。
2、课题要解决的主要问题和具体要求
构成文本的词汇数量是相当大的,因此,表示文本的向量空间也会很大,考虑进行降维是非常有必要的。而译名、机构名、地名等未登录词的识别,以及如何将它们整合到模型中,也是需要研究问题中的难点。最后是需要构造朴素贝叶斯分类器实现良好的分词效果。
3、论文:10000字以上(部分特殊专业根据实际情况,经教务与资产管理处确认,可适当调整有关字数方面的要求),包括绪论、正文、结论、参考文献等。
二、主要参考文献
[1] 崔哲. 基于朴素贝叶斯方法的文本分类研究[D].河北:河北科技大学,2018.
[2] 刘文鹏. 基于词库与贝叶斯定理的中文单词分词方法的研究[D].湖北:华中科技大学,2012.
[3] 韩晓梅. 分词技术在异构数据统一检索中的研究及应用[D].江苏:南京航空航天大学,2012.
[4] 刘丹,方卫国,周泓.基于贝叶斯网络的二元语法中文分词模型[J].计算机工程,2010,36(01):12-14.
[5] 徐哲,刘循.贝叶斯决策树在英文现在分词词性识别中的应用[J].计算机应用,2009,29(09):2571-2574.
指导教师签名:
年 月 日
|