目 录
摘 要 ........................................................................................................................................ 1
第一章 作品概述.................................................................................................................. 2
1.1. 背 景 分 析 .............................................................................................................. 2
1.2. 相 关 工 作 .............................................................................................................. 3
1.3. 特 色 描 述 .............................................................................................................. 3
1.4. 应用前景分析 ...................................................................................................... 3
第二章 作品设计与实现...................................................................................................... 5
2.1. 系 统 方 案 .............................................................................................................. 5
2.1.1. 数据获取.................................................................................................... 5
2.1.2. 数据初步分析与数据标记........................................................................ 5
2.1.3. 数据再分析................................................................................................ 6
2.1.4. 特征工程.................................................................................................... 9
2.1.5. 训练模型 11
2.1.6. 模型评估与优化 11
2.2. 实 现 原 理 ............................................................................................................ 12
2.2.1. 分类模型介绍.......................................................................................... 12
2.2.2. 文本编码模型-Bert ................................................................................. 13
2.3. 软 件 流 程 ............................................................................................................ 13
2.4. 功 能 .................................................................................................................... 14
2.5. 指 标 .................................................................................................................... 18
第三章 作品测试与分析.................................................................................................... 21
3.1. 测 试 方 案 ............................................................................................................ 21
3.2. 结 果 分 析 ............................................................................................................ 22
第四章 创新性说明............................................................................................................ 24
第五章 总结........................................................................................................................ 24
参 考 文 献 .............................................................................................................................. 26
附 件 ...................................................................................................................................... 27
附 件 一 .......................................................................................................................... 27
附 件 二 .......................................................................................................................... 31
摘要
现如今网络招聘的兴起,可以看出,企业愈来愈主动拓展眼界,积极向外寻找适合的人才。与此相协调的是,而今求职者在寻找合适职位时,不仅仅局限于所在地区的企业,对于网络招聘的依赖程度日益增高。网络有效地拉近了全国范围内企业与求职者的距离。招聘的网络化已成为一种普遍的招聘模式。
然而,在线招聘并非一片净土,与之相反,由于网络平台的开放性、不安全性以及相关制度和法律的不健全等等原因,在线招聘平台逐渐变成了欺骗者的“无法无天之地”, 特别是随着互联网的普及,受害者人群规模和地域范围呈扩大趋势。到目前为止,最常见的在线诈骗案例是就业诈骗。与电信诈骗问题不同的是,这一问题尚未得到应有的重视,到目前为止仍未得到充分的探索。
针对以上需求,本项目定义并描述了这一严峻的新型网络安全研究课题的特点。与此同时,我们提供了一个公开可用的中文招聘数据集,包括8640条带标签的招聘信息,并在此基础上提出一种在线检测与分析招聘信息真假的方案,发明了特征与文本相结合的评估方法以及一系列针对于招聘领域信息的分析方法,提供了虚假招聘信息检测与分析的接口,以此为核心建立了一个在线招聘欺诈检测平台。
关键词:欺诈检测;在线招聘;就业骗局;工作骗局;数据挖掘;机器学习;自然语言处理; 数据集













