目录
1 选题的背景和意义
1.1 选题的背景
1.2 国内外研究现状及发展趋势
2 研究的基本内容
2.1 基本框架
2.2 研究的重点和难点
2.3 拟解决的关键问题
3 研究的方法及措施
4 预期成果
5 研究工作进度计划
参考文献
1 选题的背景和意义
1.1 选题的背景
伴着 21 世纪互联网和计算机的快速发展,人们相互沟通交流,表达观点也越来越方便。网络给我们带来了难以估量的信息,也大大拓展了我们的言论空间。在新闻、微博、论坛、视频、游戏评论中,我们都可以看到大量各种各样的言论。由于网络的开放性、虚拟性和隐蔽性,我们经常可以看到大量的暴力语言,这些网络暴力语言给他人的精神和心理带来了严重的侵犯和损害。然而网络的大部分平台并没有做到非常有效的管理,他们采用的策略基本都是屏蔽掉少量常见的网络暴力词汇,而网络暴力语言仍然比比皆是。所以寻找一种新的网络暴力语言甄别方法显得非常必要。
1.2 国内外研究现状及发展趋势
21世纪初伴随着一些在网络上广泛传播的社会事件以及网络言论的自由性引发了人们对网络暴力语言的关注,2007年众多学者开始从社会学、心理学和传播学等领域分析网络暴力产生的原因,指出了网络暴力语言的特点,并提出许多建议倡导文明上网[1][2];2009年廖德明从脏话的性意识中分析出复杂的两性心理与社会关系,为网络暴力语言的禁止提供了一定参考[3];2010年李宪玲从社会、个体、网络传播等各个层面剖释了网络暴力语言形成的原因及其危害性,并从法律、舆论、监管等多个方向提出了稀释暴力语言的方法[4];2014年缪锌透析网络暴力语言成因,通过掌握其实质探求其解决方法,认为民众的网络言论自由不该被约束而应该通过法律、科技的进步、自律等方式进行维持[5];2016年杨偃成吸取前人经验,科学地对网络暴力语言进行了界定与分类,从语言学的角度深入研究了网络暴力语言[6];2019年刘小琦从新闻叙事学的角度多方面得去发掘网络暴力语言的产生因素,同时也提议了维持保护良好网络语言环境的管制策略[7]。
国内关于网络暴力语言甄别的研究并不多,黄瑞在情感分析的研究基础上,提出了基于词典和规则的网络暴力语言检测方法,并以此创建了一个网络暴力语言语料库[8]。网络暴力语言甄别作为情感分析的一个方向,虽然研究不多,但是可以借鉴情感分析的基本原理和关键技术。
情感分析的研究在21世纪飞速发展,如今已经是国内外研究的热点。最近几年,国际上和数据挖掘、人工智能、自然语言处理等多个领域相关的高级会议每年都会有大量和情感分析有关的论文出现。由中国中文信息学会举办的自然语言处理联合学术会议、全国信息检索学术会议、全国计算机语言学学术会议等多个顶级会议里面越来越多的内容都和情感分析有关。
国内徐琳宏等人通过手工标注和自动生成的方式构建出情感词典本体库,分析了情感语料库的特点及应用,对情感分析研究做了初步的探测[9];李钝、曹付元等人基于语言学的角度,提出中心词概念对短语中各词的倾向性进行计算,研究了以中心词为基础的情感倾向分类识别方法[10];闻彬等人在情感词识别中引入了情感义原, ,实现了基于语义理解的文本情感分类[11];刘志明、刘鲁采用SVM和IG,以及TF-IDF作为特征项权重,对微博进行了情感分类的实证研究,表明情感分类性能依赖于评论的风格[12];梁军等人将LSTM扩展到基于树结构的递归神经网络上,