一、毕业设计(论文)的主要内容及要求
1、开题报告和文献阅读
(1)文献阅读:查阅文献应不少于15篇,其中外文文献不少于2篇,近5年内的文献数应不少于文献总数的1/3,并应有近2年内的文献。
(2)文献综述:3000字以上,包括国内外现状、研究方向、进展情况、存在问题、参考依据等。
(3)开题报告:2000字以上,包括选题的意义、可行性分析、研究的内容、研究方法、拟解决的关键问题、预期结果、研究进度计划等。
(4)外文翻译:3000字以上(翻译成中文后的汉字字数)。
2、课题要解决的主要问题和具体要求
要解决的主要问题:
豆瓣是一个书影音的社区网站,提供了电影等作品的信息,人们在上面发表个人对电影的看法和评价,这些影评中含有丰富的情感,具有重要的价值。通过对影评的预处理,进行分析挖掘,判断评论数据的倾向和舆论倾向,得到潜在价值。
具体要求:
(1) 对影评进行基本的预处理操作,包括数据预处理、中文分词、停用词去除等操作。
(2) 基于语义网络和LDA主题模型对数据的情感进行分析。
(3) 获取文本中主要的评价词语,提取数据中有价值的内在内容。
3、论文:10000字以上(部分特殊专业根据实际情况,经教务办确认,可适当调整有关字数方面的要求),包括绪论、正文、结论、参考文献等。
二、主要参考文献
[1] 徐钟. 隐马尔科夫模型在中文实体分类中的应用及研究[D].南昌大学,2012.
[2] 邹若晨. 基于语料分类的网络文本分词研究[D].华南理工大学,2013.
[3] 周祺. 基于统计与词典相结合的中文分词的研究与实现[D].哈尔滨工业大学,2015.
[4] 刘岩. 基于MMSEG算法的中文分词器的设计与实现[D].湖南大学,2016.
[5] 周世宇. 基于词典与统计结合的中文分词方法研究及全文检索系统设计[D].华中师范大学,2017.
[6] 徐薇. 中文微影评文本情感倾向性识别技术研究[D].华中师范大学,2013.
[7] Rustamov, S.,Mustafayev, E.,Clements, M.A.. Sentiment analysis using Neuro-Fuzzy and Hidden Markov models of text[P]. ,2013.
[8] 杜振雷. 面向微博短文本的情感分析研究[D].北京信息科技大学,2013.
[9] Cabanlit, M.A.,Junshean Espinosa, K.. Optimizing N-gram based text feature selection in sentiment analysis for commercial products in Twitter through polarity lexicons[P]. Information, Intelligence, Systems and Applications, IISA 2014, The 5th International Conference on,2014.
[10] 杨阳. 上市公司新闻情感倾向对股价的影响分析[D].北京理工大学,2015.
[11] 朱小微. 基于中文影评领域情感词典的TS-BP混合情感计算模型研究[D].上海大学,2017.
[12] 张良均,王路,谭立云,苏剑. Python数据分析与挖掘实战[D] .北京:机械工业出,2016.
[13] 陈传俊. 基于网络影评文本的关系图谱系统的设计与实现[D].北京邮电大学,2017.
[14] Singh, V.K.,Piryani, R.,Uddin, A.,Waila, P.. Sentiment analysis of movie reviews: A new feature-based heuristic for aspect-level sentiment classification[P]. ,2013.
[15] 黄琦.网络影评对影评发展的正面效应[J].电影文学,2009(08):25-26.
[16] 马丽菲,莫倩,杜辉.面向中文短影评的分类技术研究[J].山东大学学报(理学版),2016,51(01):52-57.
[17] 邬鹏坤.网络影评的传播特征与价值[J].青年记者,2016(29):64-65.
[18] 钟碧园. 在线影评和在线短评对票房收入影响的比较研究[D].北京邮电大学,2017.
指导教师签名:
|