主要内容:
我国微博网名达到3.31亿之多,微博平台信息发布与传播快,产生巨大的信息量,如何从这些数据中挖掘出有价值的信息,特别是对热点问题的情感态度,对分析社会的正能量和不稳定因素有重要意义。系统功能主要分为以下几个方面:
1、 微博信息的格式化处理:主要挖掘微博标题、微博内容、发送时间、转发数、评价数等存入数据库中;
2、 微博信息的数据清洗:采用分词系统对热门微博进行分词,去停用词和特殊符号等数据清理工作;
3、 情感词库的建立:建立消极情感词库和积极情感词库,为情感挖掘服务;
4、 利用蚁群算法信息素挥发原理,对微博信息进行动态情感分析,主要完成以下几种关联:
a) 事件与情感的关联,发现一些引起积极情感的事件,和一些引起负面情感的事件;
b) 用户与情感的关联,发现一些用户在某个时间段与积极情感或消极情感的关联,给出用户的情感变化曲线
5、 以曲线的方式,给出直观的情感的波动。
基本要求:
(1)研究目的明确,设计开发合理,有一定的见解和特色;
(2)要求生成开发过程中关键文档;
(3)独立完成毕业论文(设计)任务,不弄虚作假、抄袭别人的成果,保质保量的按时完成规定的任务;
(4)完成相关英文资料的阅读与翻译;
(5)提交经测试运行正确的软件系统源代码;
(6)按毕业论文(设计)的规范化要求撰写毕业论文。 |