目录
朴素贝叶斯分类器对含暴力网络评论的甄别
1 引言
2 国内外研究现状
2.1 网络暴力语言国内文献综述
2.2 情感分析国内文献综述
2.3 情感分析国外文献综述
3 朴素贝叶斯分类器的基本原理
3.1 朴素贝叶斯分类算法的概念
3.2 朴素贝叶斯分类的定义
3.3 朴素贝叶斯分类过程
4 结论
参考文献
朴素贝叶斯分类器对含暴力网络评论的甄别
1 引言
伴着21世纪互联网和计算机的快速发展,人们相互沟通交流,表达观点也越来越方便。网络给我们带来了难以估量的信息,也大大拓展了我们的言论空间。在新闻、微博、论坛、视频、游戏评论中,我们都可以看到大量各种各样的言论。由于网络的开放性、虚拟性和隐蔽性,我们经常可以看到大量的暴力语言,这些网络暴力语言给他人的精神和心理带来了严重的侵犯和损害。虽然国家制定了相关的法律法规,网络媒体也有相关的人员或者部门进行监督管理,但是网络语言暴力在很多网络平台上仍然随处可见。究其原因,和网络语言暴力直接相关的网络暴力语言具有很强的特殊性,网络暴力语言呈现出理据性、形象性、含蓄性和口语化的特点,同时根据外在表现形式的不同,网络暴力语言可分为中文型,字母型、数字和字母混合型、中文和字母混合型四类。此外,网络平台的差异性导致同样的网络语言不能同等对待,相关部门和机构也没有公开十分有效的网络暴力判断方法和技术。因此针对网络评论暴力性的判断这一课题的研究显得极为必要。
同样,从情感分析的研究角度来看,网络评论暴力性判断这一课题的研究也有很重大的意义。情感分析,是指挖掘文本中作者对某个实体(人、事件、商品、服务等)的情感态度(高兴、愤怒、悲伤等)或者评判建议(支持或者反对、喜欢或者厌恶等)。网络暴力语言的判断可以看作是识别情感中最恶劣最极端的一种情感,因此,情感分析的发展也为网络暴力语言判断带来了很多理论基础和相关技术,同时暴力语言判断的研究也为情感分析带来了更全面的发展。一个成熟的网络评论暴力性判断系统可以为网络平台的管理带来方便,同时净化了网络气氛,为网民创造了一个舒适和谐的上网环境,减少了受害者因网络语言暴力带来的精神和心理上的伤害。
2 国内外研究现状
网络暴力的研究在国内一般集中在社会学、心理学和传播学领域,国内公开的关于网络暴力语言判断的研究并不多。网络暴力语言判断作为情感分析的一个方向,虽然研究不多,但是可以借鉴情感分析的基本原理和关键技术。文本级情感分析是指对带有情感色彩的主观性文本进行分析、处理、归纳和推理从而判断整个文本的情感倾向性。文本级情感分析的方法可以分为基于语义的方法和基于机器学习的方法。基于语义的方法是通过提取文本中的关键词来进行情感倾向性计算;基于机器学习的方法是通过提取文本中特征并建立分类模型来对文本的情感进行分类。情感分析的研究在21世纪飞速发展,如今已经是国内外研究的热点。最近几年,国际上和数据挖掘、人工智能、自然语言处理等多个领域相关的高级会议每年都会有大量和情感分析有关的论文出现。
2.1 网络暴力语言国内文献综述
21世纪初伴随着一些在网络上广泛传播的社会事件以及网络言论的自由性引发了人们对网络暴力语言的关注,2007年众多学者开始从社会学、心理学和传播学等领域分析网络暴力产生的原因,指出了网络暴力语言的特点,并提出许多建议倡导文明上网[1][2];2009年廖德明从脏话的性意识中分析出复杂的两性心理与社会关系,为网络暴力语言的禁止提供了一定参考[3];2010年李宪玲从社会、个体、网络传播等各个层面剖释了网络暴力语言形成的原因及其危害性,并从法律、舆论、监管等多个方向提出了稀释暴力语言的方法[4];2014年缪锌透析网络暴力语言成因,通过掌握其实质探求其解决方法,认为民众的网络言论自由不该被约束而应该通过法律、科技的进步、自律等方式进行维持[5];2016年杨偃成吸取前人经验,科学地对网络暴力语言进行了界定与分类,从语言学的角度深入研究了网络暴力语言[6];2019年刘小琦从新闻叙事学的角度多方面得去发掘网络暴力语言的产生因素,同时也提议了维持保护良好网络语言环境的管制策略[7]。