【摘 要】
:
文本作为人类信息的重要载体,在人们平时生活当中扮演着十分重要的角色。快速检测识别出各种生活场景中丰富多彩的文字,能够帮助人们更好地理解场景信息,能更便捷地提供各种服务。这项技术在交通安防,区域定位,灾后搜救,盲人辅助等领域均有广泛的应用。它作为一些高级智能应用的基础,拥有较高的研究价值与意义。近年来由于各类卷积神经网络的飞速发展,文本检测与识别技术也有了的很大进步,但由于自然场景文本图片质量高低不
论文部分内容阅读
文本作为人类信息的重要载体,在人们平时生活当中扮演着十分重要的角色。快速检测识别出各种生活场景中丰富多彩的文字,能够帮助人们更好地理解场景信息,能更便捷地提供各种服务。这项技术在交通安防,区域定位,灾后搜救,盲人辅助等领域均有广泛的应用。它作为一些高级智能应用的基础,拥有较高的研究价值与意义。近年来由于各类卷积神经网络的飞速发展,文本检测与识别技术也有了的很大进步,但由于自然场景文本图片质量高低不一,拍摄角度多变,文本背景复杂,形状大小各异等问题,使这项技术仍具有相当大的挑战。本文对目前存在的技术问题与难点进行了分析,在英文文本检测与识别任务上分别说明了相应的改进思路。针对深度学习中对自然场景图像中任意形状文本检测准确率不高的问题,本文提出了一种结合特征金字塔网络(Feature Pyramid Network,FPN)和内核尺度扩展算法的文本检测网络模型。FPN网络能够分别从不同的卷积层中提取特征,并在相对应的层进行融合,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的特征图按从小到大的顺序逐渐扩展为包围完整文本实例的特征图。同时在训练阶段加入了在线难例挖掘(Online Hard Example Mining,OHEM)的方法,并以迁移学习的方式采用两种不同训练策略进行训练,在ICDAR2015数据集上F-mmeasure达到了86.01%。为了准确识别自然场景具有高度形变、排列不规则的文本,本文提出一种基于文本矫正网络TRN(Text Rectification Network,TRN)和注意力编解码器网络ADN(Attention Decoder Network,ADN)的文本识别算法,其中TRN网络主要负责将自然图像中检测到的扭曲文本矫正为水平文本,然后通过ADN网络对已经矫正后的水平文本进行识别。本文在一致的训练和标准数据集下,从识别的准确性、速度和内存需求等方面进行了对比实验,在四个标准数据集上平均识别准确率达到了84.0%,并分析了该算法模型各模块的性能和优势。
其他文献
自2008年比特币诞生以来,作为比特币底层技术的区块链,在金融、医疗和保险等众多领域得到了广泛的应用。但由于区块链技术本身的特点,大多数的区块链应用都是一个个独立的网络,不同的区块链之间难以进行有效的资产或者数据的流通,所以产生了区块链跨链技术来解决不同区块链之间的价值交换的问题,在当前的跨链技术中,应用最广泛的是原子交换技术,但当前的原子交换技术还存在着安全性低、交易速度慢等问题,针对此类问题,
随着互联网不断超出预期的快速发展,单一的集中式控制器已经无法满足当今运营商、互联网企业以及用户的需求。据估计SDN未来产值在2024年将会达到704.1亿美元,单一的控制器架构延伸到多控制器架构是必然趋势。实用拜占庭算法就是多控制器同步算法之一,但是其通信和时间复杂度达到了O(2)。同时在分布式SDN选路过程中,在计算控制层面的逻辑节点拓扑时需要考虑每一个控制器所管控的交换机拓扑情况,只针对控制器
随着移动互联网和移动定位技术的快速发展,海量轨迹数据得以汇聚。轨迹分类是时空数据挖掘领域的重要研究内容。近年来,不少学者将深度学习应用在轨迹分类领域,并取得了不错的进展,但如何有效利用轨迹的时空信息一直是一个研究难点。本文以提高轨迹分类精度为目标,立足于时空信息增强和神经网络模型构建两方面,针对数据集是否含有标签,开展有监督和无监督的轨迹分类研究。主要研究工作包括:1.在轨迹数据时空信息增强方面,
随着智能手机与个人电脑的普及,以及先进的通信技术支持下,不论何时都有海量的文本信息、音频、图像等数字信息在互联网上传输。数字图像作为网络上最主要的信息载体之一,其安全问题尤其重要。图像加密技术是最常用的保护图像信息的手段,由于数字图像具有众多与传统文本信息不同的特性,导致传统的文本加密技术不再适用于图像加密。混沌系统的伪随机性、初值敏感性、遍历性等混沌特性与密码学的要求不谋而合。因此研究中将混沌系
随着互联网技术的飞速发展,在线论坛已经成为人们争论和辩论的主要媒介,用户针对某一论题或事件持有不同的论点,在互联网上进行论辩和讨论,由此产生了大量的观点评论等论辩文本,如何自动地从非结构文本中提取论辩结构是亟待解决的问题,如何利用好这些论辩文本蕴含了巨大的商业价值,同时带来了巨大的挑战,本文针对论辩挖掘领域的论点识别以及细粒度的论辩部件识别进行了研究,具体而言本文主要完成了以下工作:1.论辩挖掘中
随着空间技术的发展,激光通信因其速率高、通信容量大和强的抗干扰能力等优点在全球通信的作用日渐明显。在星间激光通信中,星间传输距离经常变化,同时也会受到太阳光、电磁粒子等因素影响,采用信道编码技术可以提高星间激光通信的可靠性。在诸多信道编码方法中,低密度奇偶校验(Low Density Parity Check,LDPC)码因其性能接近香农极限、低编码复杂度和易于硬件实现等优点而得到了广泛应用。本文
如今环境问题日益突出,如何应对经济的快速发展和资源紧缺及环境污染之间的矛盾,成为了一个全球性的难题。在此背景下,绿色供应链的建设成为推动绿色发展的关键点。为推动绿色供应链发展,政府推行了各种优惠政策以激励供应链成员进行绿色产品研发、绿色生产和绿色推广等绿色实践,其中最普遍、最有效的激励策略就是政府补贴。但是现阶段我国补贴政策的实施存在一定问题。补贴整体设计有待改善,补贴对象的选择等方面过于单一,补
空气污染问题已成为全球广泛关注的公共卫生问题,大气污染物传输模式及某地区污染物来源也成为各学科学者的研究热点。环境科学界通常使用复杂的大气传输和扩散模型,对空气污染问题进行了广泛的研究,此类研究结果缺少时序信息,不能为治理者提供具有时空针对性的治理决策。可视分析结合图形学、数据挖掘以及人机交互手段,帮助用户通过与交互式的可视化界面进行人机交互,直观高效地从海量信息中挖掘出用户想要的信息。在“十二五
随着人民消费需求的多样化、基础建设的不断完善以及电子商务的蓬勃发展,城市配送在整个物流体系中越来越重要,因此提高城市末端配送的服务质量和效率,对整个物流体系效率以及服务质量的提升都至关重要。当前我国的城市末端配送体系建设仍处于发展阶段,低人工成本以及之前市场的快速发展掩盖了配送组织体系落后以及服务水平低的弊端,造成了物流资源的浪费以及环境的污染,同时这也是我国物流成本占GDP比例高的原因之一。基于
车联网是物联网体系中最有发展前景,市场规模最大的领域之一,对提高交通效率和安全水平具有重要意义。当前车联网安全主要存在以下问题:(1)数据诚信问题,即,车辆数据在存储与通信过程中的一致性难以保障;(2)中心化问题,即,所有的车联网设备统一由中心服务器进行管理,在中心化服务器受到攻击或者出现恶意行为时,整个车联网将出现严重故障。由于区块链技术内生的安全性(如去中心化、不可篡改、公开透明等特性),其被