【摘 要】
:
近年来,随着视频观测技术的快速发展,特别是在自动驾驶、安防监控等领域的广泛应用,对视频数据内容信息的挖掘成为计算机视觉领域研究的热点。常见的视频通常是非限定环境下观测到的开放环境视频,开放环境视频分析理解的关键技术容易受到诸多不确定因素的影响:开放环境中目标种类繁多,现有目标检测方法没有考虑不同类别目标之间外观和属性相似性存在的差异;开放环境中目标姿态复杂,现有的头部姿态估计回归模型对不同姿态图像
论文部分内容阅读
近年来,随着视频观测技术的快速发展,特别是在自动驾驶、安防监控等领域的广泛应用,对视频数据内容信息的挖掘成为计算机视觉领域研究的热点。常见的视频通常是非限定环境下观测到的开放环境视频,开放环境视频分析理解的关键技术容易受到诸多不确定因素的影响:开放环境中目标种类繁多,现有目标检测方法没有考虑不同类别目标之间外观和属性相似性存在的差异;开放环境中目标姿态复杂,现有的头部姿态估计回归模型对不同姿态图像与角度值的隶属度差异刻画不足;在连续图像序列中的目标跟踪可能受到背景杂波、非刚性变形、严重遮挡、快速非刚性运动等因素影响,导致目标定位不准甚至丢失;不同摄像头下捕捉到的目标图像存在巨大的特征变化,导致现有目标再识别算法泛化能力弱。因此,如何根据开放环境视频获取目标准确的位置、属性、状态、轨迹等是极具挑战性的问题。本学位论文针对开放环境视频分析理解的关键技术中的目标检测与头部姿态估计中的误差度量模型,目标跟踪中的判别外观模型,目标再识别中的度量学习模型展开了研究。本文的主要研究工作和贡献如下:(1)基于属性相似性感知的预测误差度量方法。提出了一种鲁棒的属性相似程度感知的预测误差度量方法。在分类和回归等问题中,常用的深度学习算法通过交叉熵和简单的差值度量,预测结果与真实标签之间的误差,不能体现样本属性相似程度的差异。本文提出的预测误差度量模型,通过最优传输理论,将误差度量问题定义为一个概率转移问题,并利用代价函数表征不同样本属性相似程度的大小。样本属性差异越大,代价函数值越大,则预测为错误结果的损失越大,从而指导算法学习一个更加准确的模型。目标之间外观和属性特征相似性是一种固有的先验信息,本文通过分析不同类型预测误差对模型预测准确性的影响,建立了一种基于最优传输理论的深度模型预测误差度量方法。该方法充分刻画了预测结果误差严重程度的差异性。基于该度量方法,本文分别对目标检测和头部姿态估计算法进行了研究。根据不同类型目标外观和属性相似程度的不同,提出了一种考虑类别属性的目标检测算法。针对回归问题中预测结果与真实值误差大小的不同,本文建立了一种基于多阶段角度期望值预测方法。该方法更加准确地刻画了预测误差的严重程度,有效提高了模型的感知能力。(2)基于各向异性传播的目标跟踪方法。提出了一种稳定的判别外观模型表示方法。开放环境中的目标通常为几何形状的不规则目标,目标像素分布在矩形区域的中心,而边缘为背景像素。本文提出的算法利用这种先验信息,通过热传导理论对目标邻域内的像素属于目标或背景的置信度进行估计,从而实现对目标更加准确的判别。为了更好地对像素是否属于目标做判断,基于各向异性传播理论,充分利用单帧图像上的空域信息,连续帧上的时域信息,生成目标前景和背景置信图。该方法能够有效地减小连续图像序列跟踪问题中背景内容对跟踪效果的影响。针对快速移动物体的跟踪问题,提出了一种基于热源位置估计的快速运动目标跟踪方法,从而提高对快速运动目标跟踪的鲁棒性和准确性。(3)个体特异性目标再识别度量学习方法。提出了一种基于概率分布的个体特异性目标再识别度量学习方法。基于机器学习算法的图像匹配模型存在一个一般的假设前提,即训练样本与测试样本服从相同的分布。行人再识别任务中的过拟合问题是由于训练数据和测试样本在度量子空间中的分布存在巨大差异。本文提出的算法思想是约束识别结果的分布与训练数据的分布尽可能接近,从而满足模型的前提假设,提高度量模型对测试数据的适应性。针对现有度量模型存在的过拟合问题,本文对测试数据与训练数据在投影空间的分布进行了分析。基于该分析结果,本文采用半监督学习的方法估计测试个体的正样本对分布中心,提出利用分布概率约束的方法来改善度量模型在测试数据上泛化能力。该方法能够学习一种具有个体特异性的投影子空间,有效地解决度量学习算法中的过拟合问题。
其他文献
光电催化技术是直接利用太阳能生成清洁能源和绿色化工产品的重要技术之一。铟基硫化物半导体凭借其优异的光吸收、电化学以及催化性能,成为光电催化领域的热点研究材料。本论文以n型铟基硫化物为研究对象,基于硫化物本身成分和形态的可调性、多样性和通用性,通过调控铟基硫化物异质光阳极的物相组成和形貌结构,提高其光生电荷传输效率、优化表面催化反应活性和稳定性,取得了以下研究成果:基于层状材料有机-无机杂化的合成策
目前,造血干/祖细胞(Hematopoietic stem/progenitorcells,HS/PCs)的体外扩增是解决临床移植用HS/PCs数量短缺的有效途径之一,但离体培养通常伴随着其长期增殖活性的丧失。因此,体外培养如何能有效维持HS/PCs的干细胞活性且又能实现其大量扩增是当前亟待解决的关键问题。随着对造血系统的生理结构和功能调控的研究,仿生构建造血微环境来实现其有效扩增成为当前研究热点
线粒体是真核细胞进行能量代谢的细胞器。许多化学品具有线粒体毒性,可导致线粒体功能紊乱。因此,有必要筛查引起线粒体功能紊乱的化学品。仅通过实验测试的方法,难以满足众多化学品的线粒体毒性筛查需求。有必要发展快速、高效的方法,筛查化学品的线粒体毒性。定量构效关系(QSAR)模型可用于高效筛查和预测化学品的毒性。本论文针对模型训练集数据不平衡、黑箱模型难以对毒性机制进行解释、已有线粒体毒性QSAR分类模型
CO或CO2(统称COx)加氢直接制二甲醚(DME)是很有发展前景的DME生产工艺。该工艺所用的催化剂是由甲醇合成活性组分和甲醇脱水活性组分组合而成的双功能催化剂。以甲醇合成活性组分铜锌铝(CZA)为核,甲醇脱水活性组分HZSM-5沸石为壳,构筑的核壳结构双功能催化剂(CZA@HZSM-5),因其封闭的限域空间,表现出较高的DME选择性,所以备受关注。在CZA核上直接水热包覆HZSM-5合成核壳结
光催化/微生物燃料电池能够借助光催化或生物催化作用净化废水,并同步回收废水中化学能转化成电能,近年来在水污染控制和清洁能源转换领域备受关注。构筑高催化活性、高稳定性的光/电催化电极是实现高效去除污染物和转换能量的关键。金属氧化物电极具有稳定性高、价格低廉和易制备的优点,但也存在催化活性不足的问题。目前单一形式的燃料电池对难降解废水的处理效能相对有限。针对以上问题,本研究设计并制备了新型金属氧化物复
科技是第一生产力。挖掘、分析科技活动产生的学术大数据中复杂的实体关系不仅有助于学者了解科学本身的规律,提升科研效率;同时为科学技术能力的评估、教育与科研等重要资源的分配提供了有力依据。学术网络中,节点之间的关系除了较容易获取的显式关系(如合作关系、引用关系),还有无法直接获取的隐式关系(如师生关系、异常引用关系)。学术网络中的隐式关系是实体之间隐含的语义关系。对隐式关系进行深入研究有利于探究科学潜
有机半导体材料的载流子迁移率通常很低,通过对有机多环杂芳族材料进行适当的分子修饰能够改变其光化学性质、增强其载流子的输运能力。本论文的主要任务是结合密度泛函理论(Density functional theory,DFT)计算,研究室温下复杂有机共轭体系的激发态质子转移(Excited state proton transfer,ESIPT)机理和电子、空穴输运行为。通过用不同取代基在共轭分子的不
挥发性有机物(VOCs)是大气复合污染的重要前驱体之一,对环境和人体健康具有重大的危害。因此,消减和去除VOCs对于缓解大气污染问题有关键作用。催化氧化法因具有高效、无二次污染等优点在VOCs去除领域备受关注。Mn基催化剂具有多种可变价态、较强的电子转移能力和良好的氧化还原性能等优点,在VOCs消除领域表现出良好的催化性能并受到广泛研究。然而,如何进一步提升Mn基催化剂的催化性能并探究其在VOCs
高拉速连铸技术发展过程中,高的通钢量造成结晶器热负荷显著增加,高负荷浇铸引发的鼓肚、纵裂和漏钢等各类缺陷和异常层出不穷,成为影响连铸顺行和铸坯质量的瓶颈性因素。高效连铸技术的发展和高品质铸坯的需求,对铸坯质量和过程控制提出了更高的要求,迫切需要发展与之相适应的检测技术和集成装备。随着连铸的系统结构、仪器仪表和数据体量的快速增加,沿用传统方法监测生产过程已变得愈发困难,因此有必要引入基于机器学习(M
极值图论旨在探寻图中的一些参数如顶点数、边数、色数、最大度、最小度之间的关系,并给出满足某种关系的图所具有的极值结构,是图论的一个重要分支.在极值图论中,图的划分和哈密顿结构是两个比较重要的研究课题.本文主要研究了有向图公平划分和超图存在哈密顿圈的最小度条件这两类极值问题,证明了有向图在某种条件下存在一个二部划分V1,V2,使得从V1到V2的弧数和从V2到V1的弧数都比较多,并且给出了4-一致超图