基于主动学习的关系抽取题目方法研究毕业论文+Python源码及数据-毕业作品网站

设计任务书文档开题答辩说明书格式模板外文翻译范文资料作品文献课程实习指导调研下载网络教育 计算机 网站网页 小程序 商城购物订餐电影安卓 Android Html Html5 SSM SSH Python 爬虫大数据 管理系统 图书校园网考试选题网络安全推荐系统机械模具夹具自动化数控车床汽车故障诊断电机建模 机械手 去壳机千斤顶变速器减速器图纸电气变电站电子 Stm32 单片机 物联网 监控密码锁 Plc 组态控制智能 Matlab 土木建筑结构框架教学楼住宅楼造价施工办公楼给水排水桥梁刚构桥水利重力坝水库采矿环境化工固废工厂 视觉传达 室内设计产品设计 电子商务 物流盈利案例分析评估报告营销报销会计

首　页

机械毕业设计

电子电气毕业设计

计算机毕业设计

土木工程毕业设计

视觉传达毕业设计

理工论文

文科论文

毕设资料

帮助中心

设计流程

您现在所在的位置：首页 >>计算机毕业设计 >> 文章内容

我们提供全套毕业设计和毕业论文服务，联系微信号：biyezuopinvvp QQ：1015083682

基于主动学习的关系抽取题目方法研究毕业论文+Python源码及数据

文章来源：www.biyezuopin.vip 发布者：毕业作品网站

摘要
当代社会的知识已呈爆炸性增长，其中最常见的知识蕴含在非结构化的自然语言文本当中。信息抽取（Information Extraction）技术通过一组被提及的实体、这些实体之间的关系以及这些实体参与的事件来表达非结构化文本其中的语义知识。作为信息抽取中关键的一环，关系抽取（Relation Extraction）技术，通过判断给定实体之间所属关系，为文本知识理解提供了重要的理论依据和使用价值。
目前基于监督学习的关系抽取需要大量已标记样本，随机选择部分数据标记不仅是对数据资源的浪费，还会直接影响到分类模型最终的准确率。事实上，随着数据收集和储存技术的发展，获取大量未标记自然语言文本变得十分容易，因此设计一种能够有效利用未标记样本集进行关系抽取的算法具有重要的实际价值。
为了解决上述问题，本文以主动学习为切入点，实现了多种采样算法，主要有不确定性，多样性，代表性等算法，在验证主动学习适用于关系抽取任务的基础上，通过融合多种采样标准最终获得一个可以在多个数据集和多种学习模型下仍具有效性的主动学习样本选择策略。
实验证明，本文提出的多标准融合采样策略是一个具有有效性、健壮性的策略，与多个单策略采样算法相比，在多个数据集上都能够取得相当或者更高的分类精度。
关键词：主动学习，深度学习，关系抽取，多标准
ABSTRACT
Knowledge in contemporary society has been growing explosively. The most common knowl- edge is contained in unstructured natural language texts. Most of its semantic knowledge can be expressed by a group of mentioned entities, the relationship between these entities and the events that these entities participate in. As a key part of information extraction, relationship extraction has important theoretical signiﬁcance and practical application.
At present, a large number of labeled samples are needed in relation extraction based on supervised learning. Random annotation is not only a waste of data resources, but also aﬀects the performance of classiﬁer. In fact, with the development of data collection and storage technology, it is very easy to obtain a large amount of unlabeled natural language text. It is of great practical value to design an algorithm that can eﬀectively use the unlabeled sample set.
In order to solve the above problems, the paper takes active learning as the starting point, designs and implements a variety of sample selection algorithms, including uncertainty, representativeness, diversity, etc. On the basis of verifying the applicability of active learning to relation extraction tasks, an active learning sample selection strategy which can be eﬀective in multiple datasets and learning models is ﬁnally obtained by integrating multiple sampling standards.
Experiments show that the multi-standard fusion sampling strategy proposed in this paper is an eﬀective and universal strategy. Compared with multiple single strategy sampling algorithms, it can achieve comparable or higher classiﬁcation accuracy on multiple datasets.
KEY WORDS: Active Learning, Deep Learning, Relation Extraction, Multi-Criteria
ii
目录
第一章引言 1
1.1研究背景 1
1.2国内外研究现状 2
1.2.1关系抽取研究现状 2
1.2.2主动学习研究现状 3
1.3研究目标与内容 4
1.4本文组织结构 4
1.5本章小结 5
第二章相关工作 6
2.1关系抽取 6
2.2主动学习 9
2.2.1主动学习算法模型 9
2.2.2主流主动学习介绍 10
2.3本章小结 11
第三章基于主动学习的关系抽取 12
3.1抽取模型 12
3.2基本采样方法 14
3.2.1基于不确定性的采样方法 14
3.2.2基于多样性的采样方法 15
3.2.3基于代表性的采样方法 16
3.3集成采样策略 16
3.3.1基于多标准的赋权采样策略 17
3.3.2基于多标准的逐层采样策略 18
3.4本章小结 19
第四章实验及分析 20
4.1实验环境与数据 20
4.2实验评价指标 21
4.3实验结果与分析 21
4.4本章小结 25
第五章总结与展望 26
致谢 27
参考文献 27

全套毕业设计论文现成成品资料请咨询微信号：biyezuopinvvp QQ：1015083682 返回首页如转载请注明来源于www.biyezuopin.vip

打印本页 \| 关闭窗口
上一篇文章：基于MetaSploit的网络攻击研究毕业论文	下一篇文章：Java实现的企业员工考勤管理系统毕业论文及相关文档+项目源码及数据库文件

本类最新文章

SSL VPN加密算法研究毕业 …	基于SVM-BP-CNN混合模型 …	基于自监督和对比学习的实体链指方 …
基于Springboot+Vue …	基于Springboot+Vue …	基于CUDA的高精度多序列比对算 …

| 关于我们 | 友情链接 | 毕业设计招聘 |

Email：biyeshejiba@163.com 微信号：biyezuopinvvp QQ：1015083682
本站毕业设计和毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!