包含词性的朴素Bayes分类在文本分类中的应用文献综述-毕业作品网站

设计任务书文档开题答辩说明书格式模板外文翻译范文资料作品文献课程实习指导调研下载网络教育 计算机 网站网页 小程序 商城购物订餐电影安卓 Android Html Html5 SSM SSH Python 爬虫大数据 管理系统 图书校园网考试选题网络安全推荐系统机械模具夹具自动化数控车床汽车故障诊断电机建模 机械手 去壳机千斤顶变速器减速器图纸电气变电站电子 Stm32 单片机 物联网 监控密码锁 Plc 组态控制智能 Matlab 土木建筑结构框架教学楼住宅楼造价施工办公楼给水排水桥梁刚构桥水利重力坝水库采矿环境化工固废工厂 视觉传达 室内设计产品设计 电子商务 物流盈利案例分析评估报告营销报销会计

首　页

机械毕业设计

电子电气毕业设计

计算机毕业设计

土木工程毕业设计

视觉传达毕业设计

理工论文

文科论文

毕设资料

帮助中心

设计流程

购买资料

您现在所在的位置：首页 >>毕设资料 >> 文章内容

我们提供全套毕业设计和毕业论文服务，联系微信号：biyezuopinvvp QQ：1015083682

包含词性的朴素Bayes分类在文本分类中的应用文献综述

立即下载此资料（付费）

文章来源：www.biyezuopin.vip 发布者：毕业作品网站

毕业设计（论文）

文献综述

基于词性的朴素bayes分类器在文本分类种的应用

1 引言

2 国内外研究现状

2.1 国内外朴素bayes分类算法发展情况

2.1.1朴素贝叶斯的应用

2.1.2经典朴素贝叶斯算法原理

2.1.2经典朴素贝叶斯文本分类方法

2.2 国内外基于词性的文本分类研究发展情况

2.2.1 TF-IDF方法

2.2.2 LSTM网络模型

参考文献

基于词性的朴素bayes分类器在文本分类种的应用

1 引言

信息技术的迅猛发展导致电子文档呈指数级增长，在信息海洋中快速、准确、全面地找到所需信息变得越来越困难。如何有效地组织和管理信息，如何快速区分有用和无用信息，如何满足用户的个性化需求，都面临着挑战。文本自动分类是处理和组织海量信息的关键技术，可以在很大程度上解决信息的无序问题。文本分类是指，给定文档集合D={d1,d2,......,dn}，和一个类别集（标签集）C={c1,c2,......,cn}，利用某种学习方法或算法得到分类函数f，将文档集D中的每一篇文档di映射到类别集C 中的一个或者多个类别。文本自动分类始于20世纪50年代末，主要有布尔模型、概率统计模型以及向量空间模型。基于三个模型提出了诸多分类算法，其中朴素贝叶斯（Naive Bayes，NB）分类算法在所有分类算法中具有简单且性能优异的特点。

2 国内外研究现状

2.1 国内外朴素bayes分类算法发展情况

2.1.1朴素贝叶斯的应用

作为目前所有算法中理论误差最小的一型，朴素贝叶斯算法在众多领域中都有不俗的表现：

（1）在医疗机构中用以对患者进行快速分类，以便各个科室快速收治。

（2）营销部门利用该算法对所收集到的信息进行分类判断，以此调整营销策略。

（3）证券分析师则用这种算法来对前期走势进行处理，来预测行情的发

（4）甚至于现在各大搜索引擎使用的推荐算法，也可以看做是朴素贝叶斯算法的一种延伸。朴素贝叶斯算法的长项是处理某些发生频度较高，围绕某个核心问题不断扩展的事件

2.1.2经典朴素贝叶斯算法原理

参考了来自郭勋诚朴素贝叶斯分类算法应用研究^[1]这篇文献，得知了朴素贝叶斯分类器是基于贝叶斯分类算法的一种较为简单的分类器，在经历了时间的检验之后，朴素贝叶斯算法已经有了较强的理论依据。其关键性因素在于朴素贝叶斯算法中各个数据需要相互独立，互不干扰，构造出来的算法需要依赖与这一较强的假设，因此称之为朴素贝叶斯算法。根据上文中提到的贝叶斯算法的基本公式可以得出，在一定的集合 A 内，有 x1x2x3…xn∈A，且 x1x2x3…xn 的性质完全独立且互不干扰。也就是说事件 x1、x2、x3…xn 相互独立，事件 x1 的取值对 x2、xn 等事件无关。其中事件相互独立是一个很强的假设，因为现实生活中的事件很少是完全相互独立的，比如对于事件 A：明天下雨和事件 B：明天出去逛街，这两个事件，它们通常就不是完全不相关的事件。因为如果明天下雨那么会大大降低出去玩的概率，因此事件 A 和事件 B 就不是独立事件。但对于事件A：投两次硬币，第一次朝上和事件 B：第二次朝上，这两个事件就是相互独立的。对于相互独立的两个事件 A 和 B，根据贝叶斯公式可以算出 x1x2x3…xn∈A 在不同的分类属性 B1B2B3…Bn 下的后验概率，并且进行比较，取其中最大的后验概率，在此处假设为p（Bn｜Ac），则可以认为数据 AC 属于 Bn 的分类属性。对于其他的数据 An，通过该算法可以类推出其最大的后验概率。

全套毕业设计论文现成成品资料请咨询微信号：biyezuopinvvp QQ：1015083682 返回首页立即下载此资料（付费）如转载请注明来源于www.biyezuopin.vip

打印本页 \| 关闭窗口
上一篇文章：包含词性的朴素Bayes分类在文本分类中的应用开题报告	下一篇文章：通过评估上下文的词频对文本进行分类

本类最新文章

手部康复指板屈伸按摩装置的机构设 …	智能电表控制电路设计论文指导记 …	家用光伏发电系统逆变电源设计开 …
家用光伏发电系统逆变电源设计任 …	家用光伏发电系统逆变电源设计选 …	钢筋调直机机械结构设计开题报告 …

| 关于我们 | 友情链接 | 毕业设计招聘 |

Email：biyeshejiba@163.com 微信号：biyezuopinvvp QQ：1015083682
本站毕业设计和毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!