【摘 要】
:
场景文本检测作为一类特殊的目标检测任务,具有广泛的应用场景,如车牌识别、票据识别等领域。从人类感知场景文本的多层特征、双通道和注意力机制,进行改善空间信息和语义信息的场景文本检测研究,并在IC15(ICDAR2015)、Totaltext和TD500(MSRA-TD500)三个数据集上分别进行消融实验和对比实验。主要工作如下:(1)基于多层特征融合的感知方式,提出了基于增强特征金字塔网络的场景文本
论文部分内容阅读
场景文本检测作为一类特殊的目标检测任务,具有广泛的应用场景,如车牌识别、票据识别等领域。从人类感知场景文本的多层特征、双通道和注意力机制,进行改善空间信息和语义信息的场景文本检测研究,并在IC15(ICDAR2015)、Totaltext和TD500(MSRA-TD500)三个数据集上分别进行消融实验和对比实验。主要工作如下:(1)基于多层特征融合的感知方式,提出了基于增强特征金字塔网络的场景文本检测方法。该方法采用重建空间分辨率模块恢复高层特征图的空间信息,在语义信息传递路径中采用比率不变特征增强模块改进语义信息流动。消融实验、对比实验和可视化结果验证该方法改进了文本边界,提高了类文本像素和小文本的分类能力。(2)基于双通道机制的感知方式,提出了基于双向特征金字塔网络的场景文本检测方法。该方法利用自下而上的高分辨率路径增强网络的空间信息,利用自上而下的语义对齐路径缩小语义差异。消融实验、对比实验和可视化结果验证了该方法改进了低对比度文本和模糊文本的检测结果。(3)基于注意力机制的强化感知方式,提出了基于双向信息注意力融合的场景文本检测方法。该方法利用空间扩张模块将低层空间信息传递给高层特征图,利用注意力融合模块高效地融合空间信息和语义信息。消融实验、对比实验和可视化结果验证了该方法提高了长文本和邻近文本的检测能力。总而言之,论文充分挖掘并融合网络的空间信息和语义信息。在三个数据集上的大量实验和可视化结果验证所提方法提高了对复杂场景文本的鲁棒性和可靠性。
其他文献
大力培养科技人才后备军,对于我国实现高水平科技自立自强和建设世界科技强国,实现第二个百年奋斗目标具有长远意义。基于此,文章分析总结了科技创新后备人才的成长规律以及我国对科技创新后备人才培养进行的有效探索,并在分析当前影响我国科技创新后备人才培养的主要问题的基础上,提出了新时代科技后备人才培养的创新路径,包括制定支持性的法律政策,探索整合性的机制体制,营造创造性的社会环境,聚焦创新人才的必备特征,设
随着供给侧结构性改革的不断深入以及市场竞争的日益激烈,近年来破产企业的数量呈现出明显的上升趋势,而其中“无产可破”案件始终占据着不小的比例。在目前的破产制度框架下,司法破产是“无产可破”企业退出市场的唯一途径,但通常会被过早地终结破产程序,从而无法通过破产制度充分实现债权债务的公平清理,也无法为债权债务人的合法权益提供有效保障,这也在一定程度上打击了破产管理人的积极性以及债权人对破产制度的认可度,
随着汽车数量的逐年增长对城市交通造成越来越大的压力,一个高效准确的智能交通控制系统对整个城市具有重大意义。大数据时代的来临使得如何从海量交通数据中获取有效信息为群众提供出行路线的指导和建议成为了具有挑战性的课题。传统的路径推荐工作无法在推荐过程中考虑未来的交通状况,推荐结果缺少灵活性和预见性;另一方面,地图匹配模块是各类交通数据模型的必备组件之一,提供了将车辆采样轨迹转换到路网路径的重要功能,但现
《民法典》第580条第2款规定的“违约方申请解除合同”规则既关乎合同法违约责任体系的规范逻辑,同时又与司法实践中出现的合同僵局问题联系密切。因此无论是从民法理论层面还是从司法实践角度,对“违约方申请解除合同”规则作一个系统完整的研究实有必要,且具有一定的研究价值与意义。首先,该规则产生的最主要原因在于司法实践中出现的合同僵局问题,以“新宇公司诉冯玉梅案”为典型案例。面对这一特殊问题,通过对正反观点
事件真实性衡量了作者对事件发生确定性程度的描述。正确识别文本中事件的真实性,有助于对自然语言进行深层语义理解。同时,事件真实性检测对诸多自然语言处理基础研究,如情感分析、意图识别等具有重要意义。目前事件真实性检测研究主要集中在依赖单一线索的句子级任务上,忽略了多线索作用对多粒度事件真实性检测的影响。本文针对事件真实性,提出一种基于线索挖掘与表示的多粒度事件真实性检测方法。主要内容包括以下三个方面:
非破产加速到期具有必要性以及正当性。对于非破产加速到期主要有肯定说、否定说、折衷说,学界肯定说为通说,但因缺乏法律依据,司法裁判以否定态度为主,裁判思路并不统一,造成了现实困境。现有的企业信息公示等制度能一定程度上保护债权人利益,但具有局限性。现有理论上的探讨未突出该制度中的出资期限,未能注意到公司与股东之间关系的团体法属性。股东更易利用其优势地位对公司进行控制,且其享有的出资期限利益不具有对价性
从布局生成图像是计算机视觉热点任务之一,有助于内容生成、数据增广等任务。针对外观扭曲、伪影及语义信息利用不充分等问题,从类别、概率信息、残差角度挖掘显式和隐式语义,开展多元语义信息引导的图像生成研究,并在COCO(Common Objects in Context)和VG(Visual Genome)数据集上进行验证。具体工作如下:(1)针对生成图像中目标外观不准确及伪影问题,提出类别信息引导的生
在新型支付方式发展的背景下,法教义学应当对处分意识、欺骗行为、第三方支付机构及其衍生支付方式的规范地位和“机器”能否被骗等问题做出回应。第一,就处分意识本身而言,概念尚未明晰,内容亦不明确;处分意识必要说主张以主观标准认定诈骗罪的成立,使得处分意识的内容带有价值选择倾向,在认定上存有主观恣意性,这是处分意识必要说试图在盗窃与诈骗之间划定绝对的鸿沟所形成的反噬;反观处分意识不要说,判断财产处分时并不
<正>一方面,"做数学"是学生学习数学的重要方式,但在教学中,常常不受重视。另一方面,在"延时服务""义务教育禁止超前学习"等新政后,建构合适的拓展课程也是学校满足社会需要、回应社会关切的重要内容!为此,上海悦远教育与超脑麦斯携手,一起呈现"数学活动课"工作坊!工作坊提供6样适合所有年段学生的学具及配套学习单。参会教师不仅全程在操作中体验,
近年来,随着城市化进程的不断加快,城市公共交通服务日渐完善,与只可以行驶固定路线的公交、地铁相比较而言,出租车作为短途旅行的主力军,因其具有覆盖范围广、流动性强以及隐私性强等特点而成为大多数居民的出行选择。然而,不断增加的出租车在为城市居民提供便利的同时也不可避免地给交通管理者带来了挑战。首先,乘客的需求在空间和时间上的分布不均导致了出租车空载率较高;其次,一些出租车司机为了获取更多利益而故意绕路