像素聚合和特征增强的任意形状场景文本检测

来源 :中国图象图形学报 | 被引量 : 0次 | 上传用户:waterhunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的获取场景图像中的文本信息对理解场景内容具有重要意义,而文本检测是文本识别、理解的基础。为了解决场景文本识别中文字定位不准确的问题,本文提出了一种高效的任意形状文本检测器:非局部像素聚合网络。方法该方法使用特征金字塔增强模块和特征融合模块进行轻量级特征提取,保证了速度优势;同时引入非局部操作以增强骨干网络的特征提取能力,使其检测准确性得以提高。非局部操作是一种注意力机制,能捕捉到文本像素之间的内在关系。此外,本文设计了一种特征向量融合模块,用于融合不同尺度的特征图,使尺度多变的场景文本实例的特征表
其他文献
目的基于哈希的跨模态检索方法因其检索速度快、消耗存储空间小等优势受到了广泛关注。但是由于这类算法大都将不同模态数据直接映射至共同的汉明空间,因此难以克服不同模态数据的特征表示及特征维度的较大差异性,也很难在汉明空间中同时保持原有数据的结构信息。针对上述问题,本文提出了耦合保持投影哈希跨模态检索算法。方法为了解决跨模态数据间的异构性,先将不同模态的数据投影至各自子空间来减少模态"鸿沟",并在子空间学
目的随着移动互联网和人工智能的蓬勃发展,海量的视频数据不断产生,如何对这些视频数据进行处理分析是研究人员面临的一个挑战性问题。视频中的物体由于拍摄角度、快速运动和部分遮挡等原因常常表现得模糊和多样,与普通图像数据集的质量存在不小差距,这使得对视频数据的实例分割难度较大。目前的视频实例分割框架大多依靠图像检测方法直接处理单帧图像,通过关联匹配组成同一目标的掩膜序列,缺少对视频困难场景的特定处理,忽略
目的针对现有肺结节检测算法存在的因肺部计算机断层扫描(computed tomography,CT)图像肺结节与周边组织复杂性导致结节本身结构差异性不明显的问题,以及特征提取网络多次下采样造成图像分辨率降低进而导致检测结果差、仅使用网络顶层特征图进行预测造成图像空间信息丢失进而导致小结节漏检等问题,提出了一种基于注意力机制和特征金字塔的肺结节检测算法。方法根据语义与空间特征补偿机制以及卷积神经网络
通过比较不同种类消毒方式擦拭物体表面,为临床实践选择最优的消毒方法。选择院内ICU三个病区共计33张床位进行以下分组,A组为可固化复合长链季铵盐湿巾组;B组为纱布加75%乙醇组;C组为复用消毒毛巾加0.5%含氯消毒剂组。分别对其消毒后5 min、8 h及24 h进行采样,观察其擦拭消毒效果及抑菌时长等。结果发现可固化复合长链季铵盐湿巾与含氯消毒剂抑菌时间无明显差异,但消毒湿巾使用依从率高于其他两组。75%乙醇与其他两种消毒方式相比,消毒物体表面效果较差,抑菌时间较短。本研究显示可固化复合长链季铵盐类消毒湿
脂质在人类饮食中占有重要地位,既可促进身体健康又可能成为疾病的来源。不同类型脂质的存在提升了食品的风味、感官评价,在人们对食物的可接受性方面起积极的作用。目前对于脂质及其应用的研究中很少考虑食物基质或脂质对人类消化吸收过程产生的影响,这些影响可能超出摄入脂肪的种类或数量的重要性。本文阐明脂质经口腔、胃及小肠的消化过程,以及脂肪酸分子在小肠内的分子吸收机制,总结脂质的组成、食物结构及蛋白质和膳食纤维等组分对脂质消化吸收的影响,为研发功能结构脂或评估天然及重组脂质对人类健康的影响提供参考。
目的借助深度学习强大的识别与检测能力,辅助人工进行电力场景下的危险描述与作业预警是一种较为经济和高效的电力安全监管手段。然而,目前主流的以目标检测技术为基础的预警系统只能给出部分危险目标的信息,忽视了电力设备的单目危险关系和成对对象间潜在的二元危险关系。不同于以往的方法,为了拓展危险预警模块的识别能力与功能范畴,本文提出了一种在电力场景下基于视觉关系检测的自动危险预警描述生成方法。方法对给定的待检
目的肝纤维化是众多慢性肝脏疾病的常见表现,如不及时治疗可发展为肝硬化甚至引发肝癌。肝纤维化的准确评估对临床治疗和预后评估等至关重要。目前,肝纤维化的诊断通过肝穿活检判断,有创且有并发症危险。为此,基于影像学的无创诊断方法越来越受到关注。本文提出一种基于通道注意力与空间注意力机制改进的用于肝纤维化区域的自动化分割U-Net(liver fibrosis region segmentation net
本文介绍了四种不同负载类型的香精缓释技术及其在日用化学品中的应用情况,总结了日用化学品留香性能的评价方法,并对香精缓释技术在日用化学品中的应用进行展望.
目的乳腺肿瘤分割对乳腺癌的辅助诊疗起着关键作用,但现有研究大多集中在单中心数据的分割上,泛化能力不强,无法应对临床的复杂数据。因此,本文提出一种语义拉普拉斯金字塔网络(semantic Laplacian pyramids network, SLAPNet),实现多中心数据下乳腺肿瘤的准确分割。方法 SLAPNet主要包含高斯金字塔和语义金字塔两个结构,前者负责得到多尺度的图像输入,后者负责提取多
目的针对Faster R-CNN(faster region convolutional neural network)模型在肺部计算机断层扫描(computed tomography,CT)图磨玻璃密度影目标检测中小尺寸目标无法有效检测与模型检测速度慢等问题,对Faster R-CNN模型特征提取网络与区域候选网络(region proposal network,RPN)提出了改进方法。方法使用