1.任务说明:
图像中关键字是很重要的信息和与线索,基于文字信息的定位和分割算法一直以来是图像处理、传统分割算法以及机器学习的热点问题。本选题目的是实现端对端的google街景文字标识识别。
基于图像检测和识别、Google开源框架、基于C++/Python的源代码。Julia语言。
2.任务要求:
(1)对机器视觉和计算机编程有兴趣。
(2)学习C++/Python语言。
(3)利用现有机器学习框架进行文本模型训练,以检测识别出图片文本。
3.参考文献:(参考文献要求至少包含3篇外文,近2年的文献需要6篇以上,文献总量最好在15篇以上,文献内容要与毕设内容相关)
[1]Detecting Text in Natural Scenes with Stroke Width Transform Boris Epshtein Eyal Ofek Yonatan Wexler 978-1-4244-6985-7/10/$26.00 ©2010 IEEE
[2]TextBoxes++: A Single-Shot Oriented Scene Text Detector .20XX-arxiv
[3]FOTS: Fast OrientedText Spotting with a Unified Network .20XX-arxiv
[4] PixelLink: Detecting Scene Text via Instance Segmentation .20XX-AAAI
[5]WeText: Scene Text Detection under Weak Supervision .20XX-arXiv
[6]Single Shot Text Detector with Regional Attention .20XX-ICCV
[7]EAST: An Efficient and Accurate Scene Text Detector .20XX-CVPR
|