一. 课题背景及意义:
自从AlphaZero击败人类顶尖围棋高手后,人们关于人工智能的讨论就喋喋不休,从而出现了人工智能有益论和人工智能有害论两派。有许多人人认为人工智能会使一大批人失去他们所从事的行业,无情的被机器人取代。而更多人则认为,人工智能可以帮助我们创造更多的财富,创造更美好的明天。而目前我所能接触到的人工智能技术,都为人类的发展做出了极大的贡献,人类不能因噎废食。例如在图像识别领域,使用Google的TensorFlow人工智能框架可以很方便的搭建一个卷积神经网络,并且立即投入使用。
手写数字识别重大研究价值意义在于人机交互方向,提高人机交互的流畅性、方便性以及似人性。在于数字信息自动处理领域,提高处理效率,节省物力财力,加快信息传输,创造出无数的财富。手写体是人类在交流中使用的最常见的标准和常规媒介。即使引入了诸如键盘,声音命令等新技术,它也是一种有效且高效的信息记录方式。通常,手写识别系统是一种用于识别人类手写的任何语言的机制,无论是扫描的手写图像或者在电子设备上使用手写笔进行实时手写,也可以分别称为离线和在线手写[1]。此外,该系统的应用可分为数字,字符和英文字母三种。它广泛用于许多应用,如语言翻译,银行支票和关键字定位。手写数字识别系统的理论价值如下:
1)阿拉伯数字官方符号,被世界各国通用,且应用于生活的方方面面。因此研究手写数字识别具有很高的应用价值。
2)相较于汉字、英文单词等常用字符,数字识别的类型数较小,有助于做深入分析以及验证一些新的理论。
3)虽然人们已经对模式识别的手写数字领域进行了相当长时间的研究,但是手写数字识别系统仍然有很多不足,在某些情况下,还无法与人类的识别能力相提并论,人工智能还有很长的路要走。
4)手写数字识别与许多领域都有关联性,尤其是中英文拼音的识别。事实上,很多研究人员就是同时研究这两者的,由于相似性较强,结合在一起研究更易取得研究成果。
在大规模的数据统计中(如:人口普查等)需要输入极大量的数据,之前则完全要靠手工输入。而近几年来在这类任务中采用手写识别的技术已成为一种趋势。因为数据经常会大规模集中录入系统,所以可以在数字录入时加一些书写限制条件,或者在用户手写数字输入时给出限制提示,从而避免手写体数字的千差万别[2],得到良好的手写数字源,用于机器学习和自动识别。当前绝大部分操作系统,都会在用户录入数据时增加限制条件,让用户按照规范进行手写数字,另外还采用合适的图形用户界面对识别结果做全面的检查,最终保证正确无误。
银行、表格、证券是手写数字识别可以大放异彩的又一个领域。随着我国经济的迅速发展,无时无刻不产生大量的账单、支票、税务报表等等手写数据[3]。与上面提到的统计报表[4]处理相比,在这个领域的应用难度更大,因为对识别的精度要求更高,处理的表格种类更多等,这样对识别及预处理的核心算法要求也大大提高了。如果在这个方向上都能做到机器自动识别的话,就能够取得巨大的经济效益。
|