【摘 要】
:
物体检测与分割是计算机视觉的基础研究任务,也是很多重要应用的基础,例如:自动驾驶,人脸识别,安防监控。在物体检测与分割中,训练好的模型输出的每一个结果包括物体的类别、定位、以及一个置信度(概率)。该置信度在实际应用是判断物体检测分割结果可靠程度的一个重要依据,准确估计物体检测分割结果的置信度有助于提升相关应用系统的稳健性。然而,目前置信度的估计在物体检测和分割中还存在很多问题,例如,置信度和物体定位准确性不匹配、高度重叠的物体在非最大抑制过程中被部分高置信度的物体抑制,本文则针对这些问题提出相应的解决方法
论文部分内容阅读
物体检测与分割是计算机视觉的基础研究任务,也是很多重要应用的基础,例如:自动驾驶,人脸识别,安防监控。在物体检测与分割中,训练好的模型输出的每一个结果包括物体的类别、定位、以及一个置信度(概率)。该置信度在实际应用是判断物体检测分割结果可靠程度的一个重要依据,准确估计物体检测分割结果的置信度有助于提升相关应用系统的稳健性。然而,目前置信度的估计在物体检测和分割中还存在很多问题,例如,置信度和物体定位准确性不匹配、高度重叠的物体在非最大抑制过程中被部分高置信度的物体抑制,本文则针对这些问题提出相应的解决方法。
1.针对置信度和物体定位准确性不匹配的问题,本文提出一种基于候选定位评分的置信度学习方法,其中候选即为模型输出结果。目前的置信度学习方法大多只考虑物体的类别信息而没有考虑物体的定位准确性(即物体的位置是否准确),导致置信度和物体定位准确性存在不匹配的问题。本文则将两者同时考虑,提出一个定位准确性评估模型,将物体的分类信息和定位准确性进行融合,矫正原有置信度,我们的方法可以很简单地加到现有算法框架中并且可以带来明显的精度提升。
2.针对重叠很高的物体在非极大抑制(NMS)过程中被抑制的问题,本文提出了一种基于候选间定位相似性的置信度学习方法。现有方法在NMS过程中使用交并比(IoU)作为候选之间的相似度,这在物体重叠很高的情况下是不合理的。本文提出一种新的相似度度量方法,给每个候选一个表征特征,充分考虑物体间的位置关系,通过表征特征来学习候选间的相似性,来决定是否抑制候选的置信度。实验表明我们的方法可以在物体重叠很高的情况下,保留更多准确物体候选,提升物体检测的精度。
本文以定位置信度学习为主线,主要解决定位置信度学习存在的两个问题,实验证明我们的提出的方法可以很好解决以上问题并且精度有了明显的提升。
其他文献
多模态情感分析研究如何让计算机自动地监测出多媒体数据的情绪倾向、程度、类别。目前的多模态情感分析大多基于视频、语音和文本三种模态,是人工智能研究领域的一个重要方向,在日常的诸多领域中都有着广泛应用,例如,市场调查、智能人机交互和客服系统。现实场景中的多模态数据在时间序列上并不对应,难以进行有效的多模态融合。现有的多模态情感分析方法大多只适用于多模态信息已经对齐的数据,但无疑额外增加了数据处理成本。同时,现有的方法大多采用三个模态间两两融合的方式,忽略了单模态内部重要信息和三个模态的内在的相关性,因此并未很
漂亮的机身设计 虽然有很多人非常喜欢E-P1那种白色的机身,但是个人感觉它还是缺乏精致,个头有点大,重量也不是很令人满意。相比之下,松下推出的这款GF1却是吸取了上代产品的教训,这次的改进非常不错。虽然与奥林巴斯的E-P系列同属走复古风格,但是两款产品在外型上的设计还是挺大的。E-P1、E-P2看上去更加“古老”些,GF1则具有德国产品的那种棱角分明的感觉。 GF1在机身前面板提供了一个很
酷派敞篷新风尚 梅赛德斯 奔驰E-Class Convertible敞篷版 奔驰即将上市新E级敞篷版——2011奔驰E—class convertible,这部新车将在1月的美国底特律国际车展正式亮相。现行版本的梅赛德斯·奔驰CLK跑车自开始销售以来取得相当的成功,但是奔驰公司似乎有意图想要停止CLK跑车的销售,转而采用即将面世的奔驰E—class酷派和敞篷版来取而代之。新款E—class
结构健康监测(SHM)系统通过部署大量振动传感器,对工程结构动态响应特征(包括固有谐振频率和振动形态等)进行感知,可及时发现结构损伤,成为大型土木工程安全运作的保证。但为了提取结构特征,每个传感器的数据量可能达到数千甚至数万字节。对于能耗受限的无线感知网络而言,无疑将会付出难以承受的传输代价。由此产生一个现实需求:如何在保证结构动态响应特征精度下,大幅降低SHM系统网络中的数据传输开销呢?为解决这一需求,本文提出将压缩感知及其扩展矩阵补全理论应用到系统结构特征计算中。
压缩感知是一种新兴起的采样
火灾是自然界中经常发生的自然灾害,近年来发生的多次特大火灾给人们一次又一次深刻的教训。随着现代经济的发展,城市规模的扩大,建筑物高度和复杂程度越来越高,建筑的火灾危险系数也随之提高,传统的火灾自动控制系统和消防设施的弊端也愈加明显。近年来科学技术的发展和国家颁布的政策,推动了传统消防向智慧消防的发展,本文即在消防大数据到来的时代背景下,完成了基于大数据驱动的消防远程监控软件系统。
本文设计实现了一个基于大数据驱动的消防远程监控系统,可以用来监测接入物联网中的各种消防设备的运行状态。系统采用了基于
深度学习目前在大量任务中取得了巨大的成功,这些任务具有大量的用于图像识别、机器翻译和语音合成的标记数据。当标注成本太高或者时间不允许的时候,标注的数据并不是可以大量获得的。相比之下,人类可以在短时间内通过仅仅几个例子就学习到新的概念。少样本学习就是尝试通过训练一个模型来解决此问题,该模型希望可以仅仅基于少量有标签的支持集对一个未标注的样本进行分类。
本文从特征匹配和多样性迁移两个角度来研究少样本学习任务。论文的主要贡献包括:
当只有少量带有标注的图像可用于学习一个类别的识别模型时,测试
随着生活水平与科技迅速发展,大气环境污染日益加重,而固定污染源排放的颗粒物是大气污染的重要来源之一。固定污染源指化工厂、火力电厂等位置固定的大气污染物排放源。根据理论与实际调研,固定污染源排放的气溶胶粒径分布特性近似为单峰对数正态分布,需要使用三个波长的设备对气溶胶浓度与粒度谱进行测量。为选择最适合的入射光波长组合,本文基于Mie散射理论,设计实现多通道颗粒物浓度监测系统,为三波长设备关键光学参数的选取提供重要的依据。
本文基于Mie散射理论设计了优于单通道测量方法的多通道颗粒物浓度监测设备,并
对混合气体成分和状态进行有效快速的传感与监控已在多种不同领域受到人们的重视,而声学传感器拥有高灵敏性、低成本、高实时性等优势,同时由于气体分子的弛豫过程导致了声速频散现象,因此通过分解声速谱能够得到反映气体成分的弛豫特征值,这使得基于声速的气体传感方法成为目前气体传感技术的研究热点之一。
本文首先根据现有的声弛豫理论分析方法,从混合气体总有效比热容的表达式入手推导并修正了声速及声速频散强度表达式。结合用有限个声速值重建声速谱的算法,证明了气体成分浓度与重建声速谱得到的声速频散强度之间存在定量关系
苹果MacBook是苹果旗下一款针对潮流年轻人所设计的笔记本电脑,它由早期的iBook进化而来,无论是第一款彩色“贝壳机”,还是现如今摆在我们面前的“小白”,在设计上苹果MacBook一直将时尚、自由、简约作为设计出发点。就在今年,苹果MacBook从上一代的银色外观再一次回归到了经典的白色机身,除了外观的改变外,它还吸取了新的技术和新的工艺,使它再一次成为时尚科技的引领者。 时尚定位高端品
本文致力于探究高维小样本医学影像分析方法。小样本方面,本文提出了基于级联生成对抗网络和半监督学习的多参数医学影像生成方法。并设计生成复杂性度量模型自动确定生成顺序,通过先生成较复杂性较低的模态,再以生成数据作为先验信息辅助复杂性较高的模态数据的生成。本文所提出的多参数医学影像生成模型可以通过半监督学习方式达到端到端地训练。在有监督学习部分,通过约束多模态真实数据对与模拟数据对之间的重建损失,显式地学习多模态数据的联合分布。为缓解过拟合问题,在无监督学习部分通过约束真实数据与模拟数据分布之间的W距离学习不同