设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
包含词性的朴素Bayes分类在文本分类中的应用 文献综述
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

 

 

 

  毕业设计(论文)

 

 

 


 

 

目录

 

基于词性的朴素bayes分类器在文本分类种的应用

1  引言

2  国内外研究现状

2.1 国内外朴素bayes分类算法发展情况

2.1.1朴素贝叶斯的应用

2.1.2经典朴素贝叶斯算法原理

2.1.2经典朴素贝叶斯文本分类方法

2.2  国内外基于词性的文本分类研究发展情况

2.2.1 TF-IDF方法

2.2.2  LSTM网络模型

参考文献

基于词性的朴素bayes分类器在文本分类种的应用

1  引言

信息技术的迅猛发展导致电子文档呈指数级增长,在信息海洋中快速、准确、全地找到所需信息变得越来越困难。如何有效地组织和管理信息,如何快速区分有用和无用信息,如何满足用户的个性化需求,都面临着挑战。文本自动分类是处理和组织海量信息的关键技术,可以在很大程度上解决信息的无序问题。文本分类是指,给定文档集合D={d1,d2,......,dn},和一个类别集(标签集)C={c1,c2,......,cn},利用某种学习方法或算法得 到分类函数f,将文档集D中的每一篇文档di映射到类别集C 中的一个或者多个类别。文本自动分类始于20世纪50年代末,主要有布尔模型、概率统计模型以及向量空间模型。基于三个模型提出了诸多分类算法,其中朴素贝叶斯(Naive BayesNB)分类算法在所有分类算法中具有简单且性能优异的特点。

2  国内外研究现状

2.1 国内外朴素bayes分类算法发展情况

2.1.1朴素贝叶斯的应用

作为目前所有算法中理论误差最小的一型朴素贝叶斯算法在众多领域中都有不俗的表现

1) 在医疗机构中用以对患者进行快速分类 以便各个科室快速收治

2) 营销部门利用该算法对所收集到的信息进行分类判断 以此调整营销策略

3) 证券分析师则用这种算法来对前期走势进行处理来预测行情的发

4) 甚至于现在各大搜索引擎使用的推荐算法 也可以看做是朴素贝叶斯算法的一种延伸朴素贝叶斯算法的长项是处理某些发生频度较高围绕某个核心问题不断扩展的事件

     

2.1.2经典朴素贝叶斯算法原理

参考了来自郭勋诚朴素贝叶斯分类算法应用研究[1]这篇文献,得知了朴素贝叶斯分类器是基于贝叶斯分类算法的一种较为简单的分类器在经历了时间的检验之后朴素贝叶斯算法已经有了较强的理论依据 其关键性因素在于朴素贝叶斯算法中各个数据需要相互独立互不干扰构造出来的算法需要依赖与这一较强的假设因此称之为朴素贝叶斯算法 根据上文中提到的贝叶斯算法的基本公式可以得出在一定的集合 A x1x2x3…xnA, x1x2x3…xn 的性质完全独立且互不干扰 也就是说事件 x1、x2、x3…xn 相互独立 事件 x1 的取值对 x2、xn 等事件无关 其中事件相互独立是一个很强的假设因为现实生活中的事件很少是完全相互独立的比如对于事件 A:明天下雨和事件 B:明天出去逛街 两个事件它们通常就不是完全不相关的事件因为如果明天下雨那么会大大降低出去玩 的概率因此事件 A 和事件 B 就不是独立事件 但对于事件A:投两次硬币第一次朝上和事件 B:第二次朝上这两个事件就是相互独立的 对于相互独立的两个事件 A B,根据贝叶斯公式可以算出 x1x2x3…xnA 在不同的分类属性 B1B2B3…Bn 下的后验概率并且进行比较取其中最大的后验概率在此处假设为p(Bn|Ac),则可以认为数据 AC 属于 Bn 的分类属性对于其他的数据 An,通过该算法可以类推出其最大的后验概率

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
小型垂直升降机机械结构设计 任务 台式数控等离子切割机机械结构设计 台式数控等离子切割机机械结构设计
台式数控等离子切割机机械结构设计 基于PLC的罐装加工过程为全自动 基于Python电影推荐系统设计
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!