基于弱监督学习的图像协同分割与定位

来源 :西安电子科技大学 | 被引量 : 2次 | 上传用户:lpp110894
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在弱监督条件下的图像和视频协同分割与定位旨在利用少量监督信息挖掘图像与视频中存在的共同对象的问题。协同分割与定位方法可以降低对于类标信息的依赖,减轻人工标注的负担。作为一个新兴的研究领域,图像和视频协同分割和定位正逐渐受到广泛关注并不断发展。许多学者发表了相关论文。然而,这个领域仍然存在大量问题有待解决,例如光照条件的不同,尺寸和方向的差异,障碍物和遮挡,以及提高算法效率和精度等。因此,基于弱监督学习的思想,本文针对上述问题,建立了了人眼定位,图像协同分割和视频协同分割的相关理夜夜经并设计了相关算法框架,给出了全面具体的综述,取得了国际同行认可的成果。本文主要贡献如下:1.本文提出了具有旋转不变特性的人眼定位算法,实现了在人眼区域,人脸图像和全身人像中的人眼定位。人眼定位旨在从人脸图像中同时定位双眼精确位置,从而辅助人脸配准人脸识别等相关技术。然而在实际场景中,人眼和人脸图像可能存在任意的旋转角度。根据目标检测的三个主要步骤:目标表示,分类器设计,检测与定位策略,本方法首先从少量人眼样本中学习基于特征表示字典,其次运用基于稀疏表示的分类器结合一种类金字塔检测策略生成人眼位置热度图,最后利用先验知识提高定位精度。实验结果表明该方法能够在任意旋转下精确定位人眼,具有良好的旋转不变特性。2.本文提出一种基于交互学习的协同分割框架并提出了两种算法。图像协同分割旨在同时勾勒出多幅同类图像中的共同存在的目标的精确到像素级的轮廓。大多数现有图像协同分割算法主要关注共存目标的两种特性:显著性和相似性,但往往仅侧重于二者之一。(a)首先,在交互学习框架下,本文提出了一种基于结构稀疏和判别学习的协同分割方法(简称为OUR1)。首先针对共存目标的稀疏性,设计了基于加权结构稀疏的低秩矩阵分解算法。其次针对共存目标的相似性,设计了基于逻辑回归的判别学习算法。本方法利用结构稀疏的权值和逻辑回归参数之间的交替优化完成稀疏性和相似性的交互学习。同时,大多数加权结构稀疏算法直接利用先验知识对权值赋值,本文提出了对于结构稀疏权值的交互学习算法,从而获得具有目标导向性的著性结果,而非基于经验值的显著性。(b)其次,为了进一步充分挖掘图像结构种的几何信息,本文提出了一种基于结构稀疏和树图匹配的树图切方法实现基于交互学习的图像协同分割(简称为OUR2)。这种方法通过结合基于结构稀疏的显著性分析和基于树图匹配的相似性判定于树图切框架下,完成显著性和相似性的交互学习。相比于OUR1,基于树结构的图匹配深度挖掘了共存目标间的相关性。同时,本方法还在图切框架种引入了基于图像纹理和图像邻域的约束项,从而进一步提高了协同分割的准确性。实验证明本文提出的以上两种方法,由于考虑了显著性和相似性之间的交互学习,在公共数据库上取得了更为精准的协同分割结果。其中,OUR2算法在图切框架下充分利用了图片结构信息,获得了优于OUR1的分割结果。3.本文提出了一种基于交互学习的协同分割统一优化方法(OUR3),进一步提高协同分割算法的效率和对于目标的适应性。该方法利用拉普拉斯矩阵将基于树结构稀疏的显著性检测方法和基于树图匹配的相似性评估方法整合于一个统一的框架下,采用增广拉格朗日乘子和平滑近端梯度来优化求解,获得共存目标的分割结果。同时,本文还提出了两种策略:激活点策略和树重构策略。激活点策略基于目标导向的显著性自适应地选择关键节点,从而压缩搜索空间,提高算法效率。树重构策略通过交互学习结果调整图片树结构,从而保持目标完整性,提高分割精度。实验证明,这种方法能够提高算法效率,同时获得更为精确的协同分割结果。4.本文提出了一种基于深度特征的视频协同分割,研究在弱监督情况下对预训练的深度网络进行再利用。该方法首先利用训练好的用于图像语义分割的条件随机场递归网络对视频图像进行特征提取,试图将深度特征的优良性能引入视频协同分割的系统中。然后,将深度特征运用于基于聚类的协同分割框架中,通过分析帧内,帧间以及视频之间的先关性给出共存目标的初步分割。最后再次利用训练好的条件随机场递归网络,通过利用初步分割结果对相关网络层的加权,进一步提高分割结果的精度。实验结果展示了深度学习方法同视频协同分割结合的可能性。
其他文献
研究新时期工会干部培训模式,改革和创新适应不同层次工会干部特点的培训方式方法,对于提高培训工作的针对性和实效性具有重要意义。传统的工会干部培训模式有利有弊,教学改
工会干部培训工作是兵马未动粮草先行的先锋官,是学习宣传贯彻中共中央对工会组织的指导思想和全总工作指导方针和重点工作部署的重要渠道,也是工会干部转变思想、提高素质和
“面对入世新形势,要让石药较快地融入经济全球化,关键取决于食业产品的科技含量”,石药集团董事长蔡东晨先生近日在谈到是怎样取得脑血栓“克星”恩必普这一科技成就时坦言,“企
目的:分析笔者所在医院烧伤患者感染细菌分布及耐药性,为临床合理使用抗生素提供依据。方法:回顾性分析2014-2018年烧伤患者创面分泌物、痰液、深静脉导管、血液标本中分离的
通江县位于四川盆地东北部,通江方言属于西南官话成渝片。本文通过对通江方言的调查材料,主要描写了通江方言的20个声母、37个韵母和4个声调,分析了其声韵调的特征。不仅能给
社会新闻是都市类报纸的主要内容之一,它与时政新闻、经济新闻、国际国内新闻、文化体育新闻等共同构成了都市类报纸丰富的新闻内容,深受广大受众的关注和喜爱。
分析了造成某电厂410t/h锅炉磨煤机电机扫膛的原因,说明了电机扫膛的危害;从设备检修和生产运行管理两方面提出处理和事故防范措施。在设备检修上,通过改变镶套材料材质、规
本文研究了两种新型的基于热平板上莱登弗罗斯特效应的自推进器件。具有莱登弗罗斯特效应的液体被我们应用于制备一种能够稳定维持该种效应的器件,就目前来讲,这是首次将一个
目的:探究在直肠癌合并糖尿病患者围术期护理中应用加速康复外科的效果,分析其对患者睡眠的影响。方法:选取2017年1月至2018年12月福建医科大学附属第一医院收治的直肠癌根治
针对磁致伸缩导波无法确定管道缺陷周向位置的弊端,研究了一种利用阵列式磁致伸缩导波传感器对管道裂纹进行周向定位的方法。分析了非轴对称声源所激发导波的振动模态,计算了在