设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计 |
![]() |
![]() |
首 页 | 机械毕业设计 | 电子电气毕业设计 | 计算机毕业设计 | 土木工程毕业设计 | 视觉传达毕业设计 | 理工论文 | 文科论文 | 毕设资料 | 帮助中心 | 设计流程 |
您现在所在的位置:首页 >>理工论文 >> 文章内容 |
![]()
无花果 1.文本阅读器的系统体系结构 图1显示了文本阅读器系统的系统体系结构。用户需要在他们的安卓智能手机中安装文本阅读器应用程序。他们将把一个图像作为应用程序的输入,它将处理系统中的图像(将图像转换为语音)。处理后,文本阅读器应用程序将将语音的输出转换为用户应用程序,并以语音模式向用户说话。 在所设计的系统中有三种不同类型的模块。首先,使用预处理图像模块将原始图像转换为更好的表示方式。这将有助于获得一个清晰的输出结果。然后,利用OCR模块,使用OCR算法将捕获的图像转换为文本。最后,将获得的文本在TTS模块中转换为语音模式。表2给出了用户应用程序系统中每个模块的细分信息。 表2。文本阅读器系统的详细信息
2.2. 文本阅读器系统的流程图
无花果 2.文本阅读器系统的流程图 图2显示了文本阅读器系统的流程图。从一开始,它就将打开摄像头,允许用户捕捉到一幅图像。如果用户已经捕获了图像,它将继续处理图像,如果用户不想再捕获图像,应用程序将停止。在图像处理中,它将捕获的图像转换为文本,并将文本转换为语音。在转换完成后,它将显示文本。然后,用户可以选择是捕获另一个图像还是终止应用程序。 3. 系统实施3.1 模块实施 安卓Studio[12]用于为文本阅读器系统创建移动应用程序。它被分为两个部分,即用户侧和系统侧。用户侧可以作为用户使用的前端界面(前端),用户可以查看。同时,系统侧是产生系统输出所采取的过程。它充当了系统的后端。图3展示了该系统的模块实现。每个系统由三个模块组成,分别为“检查权限”、“捕获图像”和“图像显示的结果”,系统侧为“图像预处理图像”、“将图像转换为文本”和“将文本转换为语音”。
无花果 3.移动应用程序的实现 3.2 用户实现 3.2.1 检查权限模块 当用户启动文本阅读器应用程序时,通知“文本阅读器,欢迎启动”。将被播放,以提醒用户应用程序已经启动和处理(图4)。然后,系统将使用弹出的消息来询问图像存储和相机权限。
无花果 4.文本阅读器的主页 如果安卓手机系统的运行水平低于Android6.0(API级别23),而应用程序的目标sdk版本低于23,那么它没有任何应用程序权限,因此用户可以直接使用手机摄像头,如图5所示。
无花果 5.在文本阅读器中请求权限 对于需要用户允许权限的情况,文本阅读器应用程序将发出“需要电话权限”的通知声音,以提醒视力受障人士要求进行设置。如果权限被拒绝,应用程序将被终止,只有如果用户同时允许相机和存储权限,它才会处理使用相机。如果选择了“拒绝&不要再问”,它将终止应用程序,并不能启动,除非用户改变了他们在电话设置中的权限。当应用程序因权限问题而终止时,将弹出“某些权限被拒绝”的消息。 由于文本阅读器应用程序需要人们帮助视力障碍者进行安装,因此它也请求人们在首次启动该应用程序时设置手机的权限。 3.2.2 捕获图像模块 在允许摄像头和存储权限后,系统将启动手机的OpenCV摄像头,并在横向模式下自动调整屏幕。通知声音“摄像头打开,请指向文档。”将在相机打开时出现,并提醒用户,他/她需要指向文档来捕捉图像。
无花果 6.文本阅读器中的摄像头 当所有的要求都满足了(矩形对象固定在屏幕中间,不要太小),它将播放声音“保持2秒”,然后自动捕捉图像。用户还可以使用音量下降按钮来捕捉图像。在这个应用程序中有三种方法可以捕捉图像,自动捕捉,点击屏幕中间底部的按钮和音量下降按钮,可以很容易地通过触摸找到。 当图像被捕获时,“图像被捕获”。播放“已保存的图像”来提醒用户。然后,它将处理将捕获的图像转换为语音(后端),并将通知的声音“请等待,图像正在转换为文本”。该系统还允许用户使用音量向上按钮退出应用程序。 3.2.3 图像结果模块 在将图像转换为文本后,它将在屏幕上显示文本,如图7所示。它有两种情况,如果字符串文本包含超过60%的英语单词,它将播放声音“转换是完成的”。使用音量下降按钮返回,相机和音量上升按钮退出。按任何地方开始或停止语音”,如果在第二种情况下,字符串文本中的英语单词低于60%,警报声音将播放,“完成转换。结果不好,您可以使用音量下降按钮返回相机或音量上升按钮退出。如果你仍然想检查结果,请按任何地方开始和停止演讲。”
无花果 7.查看捕获的图像 对于情况1,捕获的图像更清晰,结果良好,但对于情况2,可以假定是模糊的图像,而不是文本或英文的图像。它将请求用户再次捕获图像,但也允许用户收听结果文本。 对于这两种情况,它都会继续提醒用户播放,并通过按屏幕上的任何空间来停止语音。然后文本将以“已捕获的图像文本为”的格式向用户说话 “当用户按下屏幕上的任何空间时。它还将使用音量下降按钮返回相机(捕捉另一张图像)或使用音量上升按钮退出这个应用程序,声音“再见,再见”将被播放。 3.3 系统实施 3.3.1 图像预处理模块 捕获图像后,它将进入后端系统。图像将形成4个不同的方向,每幅图像通过转换为灰度图像,进行预处理,获得Otsu阈值,去除噪声,调整文档的角度(适合屏幕)等,以获得更好的结果。使用Python编程和OpenCV进行后端进程。 3.3.2 图像到文本模块 预处理后的图像(4幅不同方向的图像)将使用Tesseract转换为文本,并存储每个结果。每个图像的字符串文本将进行比较,并选择效果最好的图像。每个字符串文本将检查它是否包含超过15%的特殊符号,如“();*~”。如果使用=“,然后它将被拒绝。如果字符串图像包含的特殊符号小于15%,则它将计算字符串文本中包含的英文单词,并得到英文单词中计数最高的字符串文本。自然语言工具包(NLTK)用于检查字符串文本中的英语单词。 一旦选出英语单词的最高计数,它将检查英文单词在整体文本中是否超过60%。如果超过60%,它将是大小写1,字符串文本将通过使用NLTK纠正一些单词,如“lisr”到“list”,以得到一个更准确的结果。如果字符串文本中包含的英文单词小于60%,则为情况2,并且不会对字符串文本进行更正。 3.3.3 文本到语音模块 字符串文本将通过使用文本语音引擎在安卓工作室。一个包含语音格式的。wav形式的波形文件被创建并存储在电话存储器中。演讲可以在智能手机上使用wave文件播放器来播放。语音波形根据OCR输出的不同文本而变化。 4. 结论与未来工作总之,文本阅读器系统是一个有用的移动应用程序,可以通过智能手机的相机捕捉图像,帮助视障人士阅读不是用盲文书写的印刷材料。视障人士可以通过按下智能手机的音量下降按钮来捕捉图像,通过触摸或让图像被自动捕捉,人们就可以很容易地找到它。将播放通知声音,继续提醒用户应用程序的过程。图像的文本将被转换为音频,这样用户就可以通过听力阅读印刷材料而不使用视觉。然而,它只局限于检测英语单词和工作良好的无格式印刷材料。 未来的工作将包括增强OCR技术,以识别非常小的单词,并提高打印图像的准确性。此外,该移动应用程序不仅可以转换英语语言,而且还可以转换任何其他语言。同样值得一提的是,该音频也可以用英语以外的其他语言播放(将英语文本翻译成不同的语言语音)。 1.3. 确认该项目由USM短期资助(PKOMP/6315262)支持,是马来西亚大学(RCVIP)和马来西亚大学(UniMAP)先进传感器和技术中心(CEASTech)合作项目的一部分。 1.4. 参照[1] 世界卫生组织(世卫组织),《世界愿景报告》。2014. [2] W.H.组织,《疾病及相关健康的国际统计分类》 问题,”2011年。 [3] I.S.为E.的视力,“20/20视觉活动-眼图”,2006年。 [4] M.鲍文等人。,“痴呆症患者视力障碍的患病率(PrOVIDe研究):一项针对60-89岁痴呆症患者的横断面研究,以及对个人、护理人员和专业观点的定性探索”,“治愈”。保存交付。物品,第10卷。第4页、第21页。1–200,2016. [5] T.Saba,G.苏龙和A.Rehman,“触摸人物分割的方法和策略调查”,Int。J. Res.发动机的旋转组合。科学。,第10卷。第1页,第2页。103–114,2010. [6] K.和V.K.,“使用树莓派对视障人士的OCR的实施”,国际科学研究所。J.纯应用程序。数学,第10卷。第119号,第15页。111–117,2018. [7] D.迪米特罗娃,《视觉障碍学生:盲文阅读率》,国际大学。J.Cogn。物品科学。雕刻Educ。,第10卷。第3页、第1页。1–6,2015. [8] L.A.Vader,“测量视力和视力损失”。,“苗圃。Clin。北Am。,第10卷。第27页,第3页。705–714,2009. [9] E.Ashrafi等人。,“1990-2013年伊朗国家和地方国家的视力损害负担; 研究协议,“拱门。伊朗医学,第10卷。第17页,第12页。810–815,2014. [10] S.K.Singla和R.K.Yadav,“基于光学字符识别的语音合成系统”,J.Appl。物品技术。,第10卷。第12页,第5页。919–926,2014. [11] N.琼德黑尔和S.古普塔,“使用OCR和机器人文本从图像中提取的文本到语音,”Int。J.最近的Eng。马纳格。物品(ijlemr)。ISSSN2455-4847,卷。03年,没有。04,pp.64– 67, 2018. [12] H.Esmaeel,“应用安卓工作室(SDK)工具”,Int。J. Adv.物品组合。科学。软。雕刻,第10卷。第5页,第5页。88–92,2019. 全套毕业设计论文现成成品资料请咨询微信号:HWFJ5828 QQ:1015083682 返回首页 如转载请注明来源于www.biyezuopin.vip
|