基于图神经网络的文本检测方法研究

来源 :河北地质大学 | 被引量 : 0次 | 上传用户:ZWCSS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然场景文本具有紧密的逻辑性与丰富的表达性,能有效提供高层语义信息。随着互联网技术的飞速发展,对自然场景文本的分析与处理也逐渐成为计算机视觉领域的研究热点之一。目前主流的文本检测方法是基于深度学习的文本检测方法,其中图深度关系推理算法(DRRG)使用一种创新性的局部图结构,将文本区域建议网络和深度关系推理网络相连接,实现模型的端到端训练和预测。但也存在一些问题,比如在使用GCN网络学习图节点的表示时容易出现过平滑问题,导致降低模型推理的精度。此外,在特征提取阶段的计算量及参数量较大、网络结构冗余,导致模型训练困难、检测速度较慢等问题。针对上述问题,开展如下研究工作:为解决DRRG算法中使用GCN进行推理时容易产生过平滑的问题,提出考虑文本组件重要性的场景文本检测算法(Scene text detection algorithm considering the importance of text components,CITC)。其使用图注意力机制对图上表示文本组件的节点之间的连边分配自适应权重,能够有效缓解由GCN引起的过平滑问题;使用改进的密度聚类方法对推理后的文本组件进行聚类,减少原算法中使用宽度优先搜索算法的时间复杂度。为进一步减少CITC算法的计算量及参数量、精简网络结构,提出基于CITC的改进算法:轻量化深度关系推理场景文本检测算法(Lightweight deep inference scene text detection algorithm,LDIS)。首先对Mobile Net V2网络中的结构进行精简,删除底部多余卷积层和池化层,精简网络结构并减少计算量;其次通过基于深度可分离卷积的深度特征提取模块,对特征图在空间和通道两个维度上分别进行卷积运算,进一步减少参数量;最后引入通道混洗机制,有效利用不同通道在相同空间上的特征信息,弥补模型特征提取能力。为验证算法有效性,将LDIS算法分别应用于身份证文本检测和营业执照文本检测中。在一定程度上缓解了身份证文本检测受光照强度、拍摄角度影响等图像质量问题,提升了身份证文本检测的准确率。解决了营业执照文本检测受相邻文本区域密集以及文本多样性影响的问题,提升了营业执照文本检测的准确率。
其他文献
肝脏作为人体不可或缺的器官之一,承担着人体代谢各种物质的功能,同时又是重要的热能供应器官。随着今天的社会生活节奏变快以及人们不正常的生活作息,导致肝癌患者数量不断增加。CT是根据不同的器官或组织对X线的吸收系数不同来成像的。相对于其它技术,CT成像技术比较成熟,灵敏度较高,能够比较准确的呈现身体的器官、组织和病变位置的详细特征,使医生能够更加清晰的观察,及时制定出有效的治疗方案,因此常用于肝脏肿瘤
学位
肺部医学图像是肺癌诊断和治疗的重要辅助工具,肺癌早期在医学图像上的主要表现是肺结节,因此对肺结节的筛查与分割是肺癌诊断的有效途径。不计其数的肺部医学图像加大了放射科医生的工作量,人工智能技术的发展为辅助人工诊断提供了新的方向并在肺结节的诊断与治疗方面取得了重要进展。为进一步应用人工智能技术提高肺结节诊断的效率与准确度,提出了一种基于U-Net的肺结节图像分割算法。主要工作如下:第一,针对肺结节图像
学位
近年来,在高层民用建筑中因电瓶车充电引起的火灾事故频发,严重威胁到居民的生命财产安全。为了避免电瓶车违规进入高层建筑,在电梯内安装监控,识别电梯内的电瓶车,是防止其入内的可行方法之一。针对电梯内电瓶车识别的问题,提出了一种基于脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)的电梯内电瓶车识别模型。以该模型为基础,进行了如下三方面的研究内容:(1)研究PCNN的
学位
南宫市行政区划属于河北省邢台市,地处河北平原,近年来,在快速发展的条件下,形成了许多的地质问题。河北省实施的引黄入冀工程,极大缓解了当地的缺水问题,但由于外调水存在时限性,需要建设地下水库解决此问题。而建设地下水库最重要的参数为人工补给效果。本次研究从建设地下水库中的人工补给方案入手,对试验前补给方法的选择、引用水源条件、工期安排、工程布设、人员管理、应急预案等方面进行研究;对试验中的入渗能力和水
学位
近年来随着互联网的普及和应用,网络上的信息量呈现井喷式增长,推荐系统成为解决信息过载问题的一种重要方式。推荐算法是推荐系统的核心,决定着最终的推荐效果。基于矩阵分解的推荐算法和基于内存的协同过滤推荐算法作为经典的推荐算法被广泛应用于各种推荐系统。但是基于矩阵分解的推荐算法存在着数据来源单一及数据稀疏性等问题,基于内存的协同过滤推荐算法存在实时性不强、评分预测准确性偏低以及相似度计算模型完全依赖共同
学位
随着实际生产中各类优化问题的规模越来越复杂,对于优化问题的求解难度越来越大。国内外学者开始关注利用启发式算法来对优化问题进行求解。演化算法是一类基于群智能的元启发式算法,因为其普遍适用性与有效性逐渐成为一种应用前景非常广阔的全局优化算法。樽海鞘算法是由Mirjalili等人2017年提出的一种新型演化算法。具有容易实现,控制参数少等特点,被广泛应用于智能电网故障自愈控制研究、增强电力巡检图像、光伏
学位
无线传感器网络(Wireless Sensor Networks,WSN)具有尺寸小、成本低、部署方便等优点,在智慧农业环境监测中有着重要应用。但传感器节点携带能源有限,且农田监测具有运行周期长、环境复杂多变等特点,使得保证持续高效的数据采集传输成为环境监测的一大难点。分簇路由技术能够将网络节点合理划分成簇,科学规划多跳传输路径从而延长网络生存周期;基于分簇的数据融合技术可以通过减少节点冗余数据传
学位
随着移动互联网和云计算技术的迅猛发展,人们通过移动互联网对各种信息进行浏览的背后蕴含着巨大的商业价值,其中广告点击率预测在广告商业变现中占有十分重要的地位。广告投放取得的巨大成功的背后主要因素之一是点击率(Click Through Rate,CTR)预测技术,作为广告推荐系统和在线广告等商业应用的关键问题,点击率预测在整个移动互联网中发挥着重要的作用。特征选择是一种常用的降维方法,基于演化算法的
学位
在地震勘探中,层位追踪是解析、处理地震资料的基础工作,准确的层位信息能为地震勘探的资料处理与分析提供更好的基础工作。地震相分析技术用于解释地震资料中地质地层构造、预测油气的储存情况,为处理地震资料提供参考。近些年随着数据采集方法和技术的持续发展,地震数据资料中蕴涵的信息也随之增加。传统的层位追踪、地震相识别方法工作量大、效率低、精度差,解释过程中经常依赖于翻译人员的主观经验知识。深度学习是依托于数
学位
云计算作为一种新型计算模式,具有方便快捷、按需网络访问的优势,也大大满足了数字经济时代企业和个人日益增长的数据计算需求。任务调度是云计算环境中的一个重要技术,是将用户提交的任务分配到虚拟机资源上的过程。任务调度的结果不仅会直接影响用户使用云计算服务的满意度,还影响着云计算服务商的利益问题。鉴于云计算任务调度问题的NP属性,主流的任务调度方法一般应用启发式智能算法进行求解。由于启发式智能算法数学基础
学位