一种基于物体对象相似性的无监督特征表示学习方法

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:stoneinhigh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习的发展为计算机视觉、自然语言处理以及语音识别等众多领域带来了颠覆性的改变。随着卷积神经网络自动提取特征的能力越来越强,计算机视觉在人脸识别、自动驾驶等方面也不断发展。视觉图像的特征提取是机器理解视觉图像的重要内容之一。无监督视觉特征表示学习的目标是从无标签的视觉数据中学习出有利于视觉理解的特征表示,对于减少人工标注的繁重工作量、发挥大量无标签视觉数据的潜力具有重要意义。目前,大部分的无监督特征表示学习算法是从静态图像中进行学习。事实上,人类的视觉系统并不是从静态图像中学习物体对象的特征,而是从包含运动物体对象的动态场景中进行学习。受此启发,本文提出了一种基于运动物体对象的无监督视觉特征表示学习算法,无需对数据进行标注来进行特征表示的学习。其核心思想是,给定各个运动物体对象后,同一物体对象的图像数据样本应该属于同一类别,将其作为自监督信息来让卷积神经网络学习特征提取,要求同一物体对象的图像数据样本的特征表示在特征空间中较为接近。本文的主要研究内容如下:采用卷积神经网络作为特征提取的基础网络,提出了基于物体对象的三元组采样算法。利用同一物体对象的图像样本一定属于同一类别这一自监督信息,进行三元组(基准样本-正样本-负样本)的采样。在同一物体对象的图像样本内部进行基准样本-正样本对的采样,然后再采样与其不同物体对象的图像样本作为负样本,从而组成三元组。哪些图像属于同一个物体的自监督信息可以通过从视频中进行物体跟踪等方法获取,本文假定事先已知。完成三元组采样后,本文设计了一种基于物体对象的三元组损失函数来训练网络。要求最大化物体对象内部图像样本的相似度,且最小化属于不同物体对象的图像样本之间的相似度。具体来说,拉近所有基准样本和正样本之间的距离,同时拉远负样本和基准样本、正样本之间的距离,从而优化网络参数。由于负样本是从不同物体对象(类别未知)的图像样本中采样获取,有可能负样本与基准样本和正样本其实属于相同类别。此时,拉远负样本和基准样本、正样本之间的距离相当于学习到更细粒度的特征表示,使得同一类别的样本之间的细微差别也被学习出来,从而学习出多粒度的特征。这个过程对优化的收敛没有不利影响。因此,基于物体对象的三元组采样算法即使在负样本与基准样本和正样本类别相同时,对卷积神经网络的训练仍然能取得成功,同时学习出多粒度的特征。本文的实验结果也证实了这一点。最后,本文将基于物体对象的无监督特征表示学习算法所学习到的特征用于分类和聚类等下游任务上,并与其它常见的无监督特征表示学习算法进行了实验对比。实验结果表明,本文的基于物体对象相似性的无监督特征学习算法比目前大多数无监督特征学习算法取得了更优的分类和聚类效果,反映了本文算法所提取出的特征的有效性。
其他文献
示范性教学是在小学美术课堂教学中应用已久的教学方法。直观明了的示范性教学能将一些难以解释的美术知识技能很直接的表现出来,让小学生清楚地知悉美术作品的产生过程。对提高小学美术课堂教学效率及对学生观察感受、情感体验、想象创造等能力的培养也有很好的效果。新课改背景下很多美术教师在示范性教学的应用中产生了一些问题,主要体现在传授美术知识技能和培养学生人文素养如何一体共存;在这个核心问题下,示范性教学应用中
党的十九大报告中指出:“十八大以来的五年,是党和国家发展进程中极不平凡的五年,解决了长期想解决而没有解决的难题,办成了许多过去想办成而没有办成的大事,推进党和国家事业发生历史性变革。”(1)进入新时代以来,面对波谲云诡的国际局势和复杂棘手的国内形势,我们必须时刻保持清醒的头脑,把握发展大势,遵循本国国情,在中国共产党的领导下进行新的具有伟大历史特点的斗争。要斗争就要进行奋斗,奋斗是发展路上不可或缺
在新时代,国际上正在进行新一轮工业革命,各个国家都在努力提高自身的科技创新能力。无论是在生物工程、新材料和移动互联网,还是在云计算、大数据领域,都有着非常突出的创新。制造业正与新一代的信息技术进行快速融合,不断涌现出新的经营模式,包括供应链精准管理、网络协同创新还有个性化定制等。总体来看,精益管理理论在国外得到较好的研究,其成熟程度也相对于国内来说更高。特别是很多学者结合领域的实际情况,进行精益管
目的:运用关联规则对中药治疗血尿为主的IgA肾病(IgAN)的临床研究文献进行分析,探讨其中医证候及用药特点,以期更好地指导临床。方法:检索中国知网、万方、VIP、Pubmed数据库,严格按照纳入和排除标准筛选合格的文献,对文献中的药名和证型进行规范化处理并建立数据库,对证候、药物的特征进行频数分析。最后,运用关联规则对中药组成与常见证候的关系进行分析。结果:1.本研究一共纳入了51篇文献,涉及3
滑雪旅游资源评价是体育旅游资源评价的一种。滑雪旅游评价体系是对所评价的地区里的滑雪旅游资源的优劣、组合情况以及组合后的优劣进行准确的判断和合理的比较。对滑雪旅游资源起到了对比、甄别和完善的作用,对于滑雪旅游资源的开发具有一定的参考价值。因此,我们根据评价体系对不同的滑雪旅游资源进行具体的,可操作的划分。构建科学、合理、准确的滑雪旅游评价体系能促进滑雪旅游资源更好的开发和滑雪旅游业的发展,起到“以评
第一章单、多节段腰椎峡部裂性滑脱矢状面形态比较目的:探讨腰椎峡部裂性滑脱患者与正常人群脊柱-骨盆矢状面形态的差异,分析多节段与单节段腰椎峡部裂患者之间矢状面参数的特征。方法:选择从2007年1月到2018年1月在我科就诊的低度腰骶部峡部裂性滑脱患者。按照发生峡部裂节段数量将纳入的453例分成单节段峡部裂组和多节段峡部裂组,其中单节段组有402例,多节段组有51例。并以158例年龄匹配的健康成人为对
无人机导航控制系统及其相关算法的设计和可靠性研究是其实现工程化应用的前提。然而,随着微小型工程无人机在各领域的大规模应用,其面临的工程任务愈发复杂,工作环境愈加恶
在大尺寸三维形貌测量中,立体测量设备的测量精度和测量广度往往不能兼得。为了得到高精度的观测数据,我们需要以较小的测量距离以及较小的视场角来对景物进行三维形貌测量,
高速公路的建设对完善国家高速公路网,辐射带动区域社会经济协调发展起着很大作用。收费高速公路项目投资规模大、建设周期长,加之建设需求的日益增长,加重了政府的财政赤字
十九大以来,中国特色社会主义进入新时代,对党的建设和党员思想政治教育都提出新的要求。“互联网+”背景下,党的建设进入发展新时期,迎来发展新模式。通过将“互联网+”有效运用到党建工作中,将“互联网+党建”运用到党员思想政治教育之中,加强了党的建设,推动了党员思想政治教育的发展。“互联网+党建”模式是全面从严治党背景下,实施网络强国战略,建设马克思主义学习型、服务型政党的关键环节,是智慧党建建成和党员