基于深度学习的企业实体识别
摘要
随着深度学习技术的发展,文字识别与自然语言处理近年来受到广泛关注。结合文字识别与自然语言处理技术解决传统方法无法处理的问题,成为企业提高自身竞争力的重要利器。
目录
基于深度学习的企业实体识别 1
摘要 1
需求分析 1
背景及研究意义 2
作品简介 2
特色描述 2
应用前景 3
需求描述 3
实验条件 4
概要设计 4
详细设计 6
文字检测模块 7
EAST算法 7
Loss计算 12
文字识别模块 15
CRNN+CTC 15
自然语言处理模块 32
Aho-Corasick算法 33
调用方法 35
隐马尔可夫模型维特比算法 36
系统测试 43
测试方案 43
算法测试 44
功能测试 45
性能测试 48
代码规范 52
工程总结与项目安排 52
总结分析及前景展望 54
存在的问题及改进方案 54
前景展望 54
参考文献 54
需求分析
背景及研究意义
实体识别技术在布局各类证件、通用文字识别等相关领域都有着重要应用前景,我们相信实体识别技术将会支持更多应用场景,满足更多用户的需求。例如,通过拍照扫描等方式,提供身份信息的快速自动录入体验,以提高边检/酒店/旅游/公共安全以及电商等行业领域的工作效率;自然场景实体识别可以捕获现实中多种场景下的文字,可有效支持虚拟现实、人机交互、图像检索、无人驾驶、车牌识别、工业自动化等领域中广泛的应用。综上,实体识别技术有着广泛的应用前景。
作品简介
企业实体识别主要应用在我们目前业务系统中的查证功能。查证功能的主要作用是将用户拍摄的店铺照片经过OCR识别后进行店铺名称的提取,然后通过店铺名称查询证照库,获取该店铺办理过的所有证照信息,方便用户进一步了解该店铺。在日常应用中,例如外出就餐时利用我们的系统随手拍摄要就餐的饭店门脸,系统会自动检测该饭店证照是否齐全以及所办证照的详细信息,方便用户做出就餐决策。
参赛者可以用附件提供的50张图片作为测试数据,提取出文字信息后汇总进Excel作为交付文件,此外附件还包括一个txt文件,文件中每行表示每张图片的标准输出。
特色描述
我们的作品相对于现有的企业实体识别技术主要有以下主要特色:
更快的收敛速度
传统的系统往往需要较大的训练数据集才可以得到较好的测试精度,这就十分不利于提升中小型企业在市场中的竞争力,我们通过进行前置文字转移技术来使得作品有了更快的收敛速度,更利于中小型企业的应用。
更快的相应速度
相对于传统的OCR算法在文字识别时更注重查全率不同,我们的系统更关注一张图片中的主要内容,也即是较大的商标LOGO,而不用去关注那些与企业名称识别无关的部分。
更巧妙的算法带来更准确的识别结果
市面上现有的算法几乎都是完全基于深度学习的判断,这样不仅让系统的运行速度降低,更重要的是这样的做法在复杂环境下会降低准确率,我们小组在深度学习的基础上增加了商标面积权重,这样的作法基于人的想法:人往往会将那些期望的景物放在图片最显眼的位置。