【摘 要】
:
图像承载着多种信息,数据量巨大,现在人类获取信息的途径中,图像是一种重要的渠道,但能够快速理解图像信息就要辅助图像文字。因为图像文字可以直观反映图像含义,解释图像内
论文部分内容阅读
图像承载着多种信息,数据量巨大,现在人类获取信息的途径中,图像是一种重要的渠道,但能够快速理解图像信息就要辅助图像文字。因为图像文字可以直观反映图像含义,解释图像内容,为图像理解节省大量时间,避免了冗余信息等干扰,所以图像中文字的识别对于快速理解图像内容具有重大意义。针对自然场景下图片文字干扰信息多,样式复杂多变,排列无规律等特点,提出应用预处理技术的CNN、LSTM特征融合的文字识别算法。首先,对图像进行PCA降维和RP随机投影处理。然后,用CNN网络从底层图像像素中获得高层抽象视觉特征,并利用CNN网络的局部感知特性建立起高层特征与底层像素的空间关系,然后利用双向RNN模型的LSTM网络来进行长短期记忆模块捕获图像全局特征。最后,利用注意力机制递归序列生成方法进行文字定位识别,得到图像文字识别结果。实验就图像特征维数、CNN隐含层数、预处理策略对图像文字识别率的影响进行了研究,分析实验结果确定了特征维数、CNN隐含层数和预处理结果的融合策略。在ICAND图像库上确定深度学习隐含层数为17层,特征维数为45,预处理融合系数为0.6:0.4,识别率最高达到97%。实验就传统OCR算法、卷积神经网络特征提取算法与论文算法设计对比试验。在ICAND图像库,隐含层数为17层,特征维数为45,预处理融合系数为0.6:0.4的确定参数条件下,得出论文算法具有最高准确率为97%,表明论文算法具有良好特征表达能力。在ICAND库、IIIT5K库、CHARS3种不同图像库上设计了算法鲁棒性的验证实验,在隐含层数为17层,特征维数为45,预处理融合系数为0.6:0.4的确定参数下,经注意力机制递归序列生成方法得出识别结果,识别率均在94%左右,换库实验表明论文算法具有良好的鲁棒性。在ICAND库、集成显卡、单机模式、固定参数的条件下对应用预处理算法与CNN算法设计对比实验验证算法的有效性,预处理算法识别率为98%,比CNN算法高44%且运行时间减少,表明应用预处理的算法具有良好的有效性,提高了处理效率。论文在研究了算法的鲁棒性与有效性的基础上,为检验算法的抗干扰能力,设计了算法在光照不同,有无遮挡物,字体是否规整三种情况下在ICAND库上的对比试验。光照强度不同情况下,本文算法识别率为98%,比CNN算法高44%,运行时间为132s,缩短了20倍;有遮挡物的情况下,本文算法识别率为98.05%,比CNN算法高50%,运行时间为64s,缩短了14倍;字体不规整的情况下,本文算法识别率为98.55%,比CNN算法高40%,运行时间为74s,缩短了16倍。验证了论文算法在不同干扰下都能保持良好的检测效果,具有良好的时效性。
其他文献
减震器总成是汽车悬架系统中震动能量吸收的一个阻尼装置,可以快速抑制弹簧吸震后反弹时的震荡,达到改善行驶平顺性的目的。因此,减震器总成的表现性能对汽车安全行驶显得尤为重要。当前我国减震器行业零部件已经实现自动化生产,但减震器总成的装配工艺由于存在诸多技术难点,尚不能实现完全自动化。国内大部分减震器总成生产厂商多采用人工辅助装配,这种传统的作业方式效率低、危险系数高、对作业人员的技能素养要求较高等,远
近些年,由于城市环境持续恶化、雾霾频发、石油资源消耗增长,国家政府多次在重大会议上强调发展新能源车辆的重要性。但目前电池发展陷入瓶颈,纯电动车辆一直以来因为续航问
图像分割是完成图像处理、分析等任务的基础概念之一,在此同时也被归属于一种计算机视觉技术。自从把分割问题提上来,就一直在推进分割技术的迅猛发展。本文研究的重点是最新
随着知识共享概念的提出,国内外学者们从企业管理、组织行为学等角度,围绕知识共享的各个维度进行了大量的研究,不断丰富知识共享的内涵。康复医学团队作为知识型组织的代表之一,康复医学知识共享有利于促进康复医学团队成员的进步,同时有利于促进康复医学团队的发展,但目前缺乏知识共享对康复医学团队发展的研究成果。因此,探讨康复医学团队知识共享的相关问题能够丰富知识共享的研究领域,具有较高的价值。目的:本研究以江
本文的研究对象为惠普打印机业务中的线束采购成本优化策略。运用供应链相关理论模型以及简单的数据模型和回归分析工具,层层推进,对惠普打印机线束采购过程中的成本优化问题
目前,我国优秀男子跳高运动员王宇已多次在国际比赛中获得冠军,但距离跳高世界记录还有一定的距离。为此,本文将辩证分析王宇的个人技术,旨在更高的提升其技术水平。在跳高运动技术中,倒二步助跑技术起承上启下的作用,主要任务是把助跑已经获得的水平速度更好地衔接到起跳环节,而起跳是跳高技术中的关键环节,是将助跑中的所获得的水平速度转化为垂直速度,获得越过横杆所需腾起高度。因此本文运用文献资料法、个案研究法、录
在对国内外汽车行业、拧紧工艺及其生产设备的发展和现状做了研究后,指出了螺栓拧紧机国内外的研究现状与发展情况。针对汽车零部件多品种、小批量的生产模式,对螺栓的拧紧质量有较高工艺要求,提出了研制一套全新的螺栓拧紧设备的必要性,并将此作为本文的主要内容。本文为解决企业的生产问题,设计一种具有一定通用性的螺栓拧紧机,该设备主要由工作台及拧紧系统组成,目前主要用于风扇支架单个M10螺栓以及驱动器总成8-M1
随着无线通信技术的快速发展,现有的固定频谱分配策略造成可用频谱资源严重短缺,同时已分配的频谱资源又存在利用率低的问题。协作频谱共享技术因具有中继协作和动态频谱接入
挂胶式负重轮能够降低行动系统的动载荷和噪声,在高速履带车辆中得到广泛应用。橡胶材料的迟滞损失特性以及负重轮与履带间的摩擦导致负重轮在转动过程中生热。随着高速履带
在过去的几十年中,人们广泛的研究透明导电电极是由于透明导电电极的应用方面非常广,包括透明显示器,触摸面板,有机光电器件和透明薄膜加热器等。最常用的透明导电电极为铟锡