文本识别技术研究及其在手机用户界面自动化测试中的应用

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:cs444444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像内容中通常包含大量的文本信息。如果能够可靠准确地识别出图像中的文本信息,对于图像内容理解是非常有价值的。但是由于拍摄条件和图像背景等条件的影响,其图像中的文本明显存在扭曲变形等问题。因此如何在深度学习理论基础上研究网络结构,提高文本识别准确率,是当前计算机视觉领域一个需要深入研究的问题。论文主要工作包括:(1)论文在已有Faster-RCNN模型基础上实现了一种场景文本检测的细粒度方法。算法将文本检测转化为一系列细粒度文本候选框的检测问题,采用宽度固定的垂直Anchor,完成对文本框的精细预测,并最后用文本行构造方法连接细粒度候选框,实现文本区域的准确预测。通过实验分析验证了算法的有效性。(2)论文提出了一种改进的端到端文本识别网络结构,改进的网络结构增加了深度,提高了文本图像的特征描述能力和在噪声下的稳定性。首先,网络采用残差模块将文本按列切分成特征向量输入到循环层。另一方面,残差模块采用堆叠层来学习残差映射,在层数加深的情况下提高了网络的收敛性。然后循环层使用长短时记忆网络学习文本之间的依赖关系,解决长序列训练过程中的“梯度消失”问题。最后通过最优路径方法进行文本标签转录。通过实验对多个测试数据集和已有典型算法进行对比分析,结果表明该网络结构能够得到更好的场景文本识别准确率,验证了所提网络结构的有效性。(3)论文针对非规则文本识别问题提出了一种基于注意力机制的文本识别网络架构。该结构在残差网络基础上引入注意力模型,替换原有的CTC解码方法,完成序列到序列的预测。此外,论文网络结构通过变形矫正模块提高网络对非规则文本识别的稳定性和可靠性。最后通过实验分析验证了算法的有效性。(4)在上述算法研究基础上,论文实现了一个文本识别驱动的手机用户界面自动化测试原型系统。为了提高手机用户界面中的文字识别率,论文创建了一个手机用户界面的OCR数据集。该数据集收集了从不同手机页面上的截图80万条。实验结果显示,该数据集能够明显提高识别准确率。最后论文通过OCR文本识别、按钮目标检测以及特征点匹配实现了对手机页面的自动兼容性测试。论文部分算法已经成功应用于北京云测信息技术有限公司的自动化测试平台。该平台使用OCR深度学习方案来支持控件定位的输入,全面提升测试产品的易用性和自动化效率。
其他文献
近年来,一起起校园欺凌的相关事件逐渐浮现在人们的视线中,“校园欺凌”四个字的热度也逐渐上升,被越来越多的人们所关注,在这些事件新闻的评论下,有不少人表示,自己学生时也受到过欺凌,但是由于性格懦弱、胆小,对方人多势众或是班中人气较高,因此并不敢反抗,随着时间的推移,离开当时所处的环境后才得以脱离苦海。校园欺凌,其所背负的内容远比这四个字的表面意义更加深重。在学校这座象牙塔中,学生之间的暗流涌动,或许
油气水多相流普遍存在于油田开发中后期的油井中,油气水三相流的参数检测一直是现代石油工业关注的热门问题之一,其中分相含率测量是油气水三相流参数检测中一个重要的研究内容,油气水三相流的流动特性十分复杂,致使油气水三相流分相含率的测量难度较大。为满足油田生产的实际需要,本文以大庆油田的实际开发策略为背景,开展基于光纤探针的油气水三相流分相含率测量技术研究。首先针对当前持气率光纤探针传感器测量参数单一的缺
为了在夜间与日光下都能够引起人们注意,在路牌、机动车标牌等金属薄板表面印染了专用油墨,使其具有颜色种类多样、表面反光性强等特点。金属薄板印制时具有较高的表面质量要
双工器是共用天线的收发机系统链路中的重要部件,作用是保证发射和接收链路能同时正常工作,并实现发射和接收信号之间的隔离。低噪声放大器作为双工器接收端口连接的下一级电
谐振式微光学陀螺(Resonant Micro-Optic Gyroscope,RMOG)是一种基于光学Sagnac效应的角速度传感器,是高精度陀螺实现微小型化和集成化的重要途径。其基本原理是通过检测谐振
肝内胆管癌是一种源自肝内次级导管上皮或其分支的癌症,它具有极高的死亡率。由于缺乏明显的早期临床症状,大多数的肝内胆管癌患者在发现时已经处于晚期,即使对符合手术条件
当代社会中,交通拥堵问题已成为了制约城市经济发展,影响社会生活正常进行的关键问题之一,交通拥堵也问题是交通科学与工程中的基础性研究问题。以信号控制为代表的现代交通
目的:反流性食管炎(reflux esophagitis,RE)是消化系统常见病之一,发病率有不断增加的趋势,疾病负担逐渐增加。现代医学治疗如质子泵抑制剂、胃黏膜保护剂等在疗效上存在一定的局限性,且有需要长期服药及副作用等问题。本研究旨在通过观察口服柴胡疏肝散、耳穴压豆联合奥美拉唑治疗肝郁脾虚型反流性食管炎的临床疗效,为反流性食管炎的治疗提供新的思路。方法:将60例肝胃郁热型RE患者随机分成观察组
在“大众创业,万众创新”现实背景下,大学生作为知识密集型群体具有创业创新的巨大潜力。全国及上海市政府颁布了一系列政策完善创业制度环境,推动保障大学生创业活动。本研
在高新技术飞速发展,智能终端快速普及的今天,人们对精确实时性的位置服务的需求日益迫切。目前室外定位技术已经较为成熟,得到广泛应用。室内环境比室外环境复杂,GPS等常用