基于深度学习的文本与遥感图像目标检测研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:z987z654z123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是指如何让机器正确检测出特定物体的位置和类别信息,以便进行下一步的应用。目标检测的应用非常广泛,如智能城市建设,快递分拣,遥感智能系统,拍照翻译等等。其中,四边形和弯曲多边形目标检测是该研究领域的一大难点。水平目标检测只需要输出目标的左上顶点和右下顶点的坐标,而四边形和弯曲多边形目标检测却需要输出目标的多个顶点坐标,这极大地增加了其难度。在文本和遥感图像目标检测中,使用水平框来标注和检测物体会引入较多的背景,难以得到目标的准确位置信息,所以在这些任务中,一般都需要以四边形或者弯曲多边形的形式输出目标的位置信息。因此,四边形或者弯曲多边形目标检测的研究对提高文本和遥感图像目标检测的实用价值具有重要的意义。随着深度学习的发展,深度学习方法也不断地被应用于多个领域,文本和遥感图像目标检测领域也因此取得了较大的发展。但是,四边形和弯曲多边形的形状和倾斜角度都会非常复杂,目标的多个顶点间的相互关系也无法使用简单的规律描述。这一定程度上限制了目标检测模型在四边形和弯曲多边形目标检测任务中的性能。针对四边形或弯曲多边形的特点,本文分别基于四边形或弯曲多边形三种主流表示方法在以往算法的基础上做出了相应改进,给出了多种四边形或弯曲多边形目标位置信息的表示方法,模型损失函数在复杂场景中不会产生歧义性。为了提升文本和遥感图像目标检测模型的性能和效率,本文做出了以下贡献:首先,针对四边形以及弯曲多边形位置信息难以准确定位的特点。本文基于深度学习目标检测模型提出回归物体轮廓上的坐标点来计算目标的位置信息。本文先通过理论分析了回归四边形的顶点会产生的歧义性,目标轮廓上顶点坐标信息的冗余以及使用水平交互比计算四边形目标交互比的缺点。之后,通过局部滑动线条点回归来解决四边形顶点的歧义性和坐标信息的冗余,这提升了模型对于目标的定位能力,使得输出的轮廓信息更加准确。此外,本文还在第一步输出旋转矩形框后,增加额外的分类和回归,这使得模型最终的输出结果是通过四边形交互比计算的,可以改善由于水平交互比计算不准确导致的分类错误。其次,考虑到回归目标轮廓上的多个顶点会加入较大的计算量,并且在一些应用场景中并不需要精准地检测出目标的轮廓,而只需要输出目标的旋转矩形包围框,所以为了减少这类任务的计算复杂度,本文提出了一种旋转矩形框表示方法,它可以反映出角度周期特性。为了解决旋转矩形框角度多变性引起的歧义性问题,本文深入分析了其周期变化规律,提出可调整周期编码方法,将角度编码成两个不同周期向量,提高了模型输出角度的准确性。进一步地,为了提高模型对于长目标的召回率,在计算交互比时,通过切割下部分和候选框等长的目标框,使得长目标也会有相应的正样本,这提升了模型对于长目标的性能。最后,正如上文提到的,通过改进的交互比计算策略可以提升模型对于长目标的性能,但是受限于卷积神经网络的感受野,它的提升有限。而基于全卷积神经网络的实例分割方案虽然不需要覆盖整个目标的感受野,但是如何正确地组合属于同一个目标的像素点是其一大难点。针对长目标数据集,本文提出将目标的中心和边缘视为概率图,边缘为0,中心为1,从边缘到中心是平滑过渡的,概率图的边缘可以准确地表示目标的轮廓位置信息,概率图的增长方向即指向目标中心,这个方向可以用来组合属于同一个目标的像素点。并且,本文还提出了一种并行计算方法用以提升组合过程的效率。
其他文献
微波炉操作简便、加热速度快,在家庭烹饪中占据不可或缺的地位。但是微波炉的使用也存在严重的缺陷,包括加热不均匀、热形不稳定等问题。目前,针对微波炉加热均匀性改善有很多研究,但是微波炉加热热形的稳定性依然较差。本课题主要从柱形微波腔的角度进行微波炉的设计研究。因为常见的微波炉腔体主要是矩形,包含长、宽、高三个方向的参数变化,而少有学者研究的柱形微波腔只有直径和高两个方向的变量,理论上能够使加热热形稳定
随着机器人技术的发展,社会对服务类机器人的潜在需求不断增大。行人跟随机器人属于服务类机器人的一种。为了完成机器人对目标人进行跟随的任务,首先需要有鲁棒性强的视觉跟
随着经济发展,新的商业模式、多样的业务类型的出现,使得现行的收入准则已经无法满足企业的需要,于是与国际准则趋同的新收入准则应运而生,新收入准则颁布后,很多企业都受到一定影响。医药流通行业性质特殊,涉及民生,同时业务也较为广泛,包括制药、医药批发和医药零售等业务,也是受影响较大的企业,国内大部分医药流通企业还未开始执行新收入准则,所以对新收入准则对医药流通行业的影响的研究是有待深入的。本文通过常用的
教育惩戒是班级管理中必不可少的一种手段,但目前教师在实施教育惩戒时却面临着许多困难,既有外部因素,也有内部因素,这导致教育惩戒在实施中存在惩戒缺失、惩戒不当等现象。本文通过文献法、访谈法、观察法等研究方法对小学班级管理中的教育惩戒实施进行了研究。对小学班级管理中教育惩戒的实施现状进行了分析,探究在实施教育惩戒时存在的问题及其原因,最后,从教师的角度提出实施建议,以期对教师实施教育惩戒有所帮助。通过
盗窃罪与诈骗罪虽因属于传统财产犯罪而为人们所熟知,以至于人们对实践中发生的大部分案件凭借直觉就能做出是盗窃还是诈骗的判断。但随着社会的发展,对于部分新颖、复杂的窃骗交织案件,是窃还是骗,仍然是众说纷纭,莫衷一是。而当该类疑难案件与民法上权利外观责任的适用交织在一起时,案件则变得更为复杂。从一起“二维码案”激起的热烈讨论中即可对上述问题窥见一二。实际上,“二维码案”属于行为人冒充权利人的身份侵犯他人
古建筑作为一种重要的历史载体,能反映历史上人们的生活和风俗习惯。同时,古建筑的营造技术,也为现代建筑的发展提供了重要参考。但国内的古建筑大部分为砖木结构,这种结构容易损毁,特别是岭南地区的高温湿润气候使得古建筑更容易受到破坏。为此,古建筑维修修缮的需求十分迫切。但古建筑修缮的造价标准主要以北方地区为主,专门针对岭南地区还未见,特别是相关研究更少。而古建筑工程造价的困难以及相应定额未能配套,极大限制
在现代企业制度下,所有权和经营权两权分离。为了解决由此产生的道德风险和逆向选择问题,股权激励制度已经成为上市公司改善公司治理、提高治理能力的必不可少的一把“利器”,并且已然进入了“常态化”时代。但是,近年来我国股市的剧烈震荡,许多实施股权激励的公司股价低于其行权价格,进而导致停止实施股权激励计划的公司越来越多。因此,公司是否应该修订股权激励计划受到社会的广泛关注。以超图软件为例,我们剖析了企业股权
大型无脊椎动物是淡水生态系统中非常重要的组成部分,是河流生态系统食物链中重要的一个环节,对河流生态系统物质循环、污染物迁移转化等过程具有重要意义,能够反映河流生态
随着证券市场的发展,利用盈余管理的方法进行财务造假的现象已经屡见不鲜,世界各国出现的财务舞弊案件都存在着一个共性的原因:上市公司内部控制的不完整性。上市公司盈余管理程度较高代表其内部控制存在问题,那么是否就证明内部控制存在缺陷,上市公司的盈余管理程度一定较高呢?过度的盈余管理会损害股东、债权人及其他财务报表信息使用者的权益,扰乱资本市场良好运行秩序。因此,无论是从企业的既有利益为基准还是从维护资本
研究背景随着老龄化进程的增快,我国老年人口的规模持续扩大,老年人的健康问题也日趋凸显,同时给社会发展带来了医疗、照护、养老等方面的压力。处于老年期的老年人由于机体