多视角与人机协同关系对齐度量学习

来源 :天津大学 | 被引量 : 0次 | 上传用户:gu22540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习的火热发展和计算机科技的进步,使得机器学习算法在计算机视觉领域取得了重大的进步。距离度量学习作为经典的机器学习方法在人脸识别、物体分类、材料分类等众多计算机视觉领域有着广泛的应用。同时,随着信息获取技术的飞速发展,数据的收集能力和表达形式变得越来越多样化。数据的爆炸式增长推动了机器学习算法的进步,大规模精确标注的数据在很大程度上提高了各种机器学习算法和模型的上限,但同时也增加了数据标注的难度和成本;而相比传统的单一视角的数据,多视角数据往往蕴含着更多的有用信息。通过对不同视角信息的分析整合,往往可以得到更加精确的分类结果,而目前大多数研究都更侧重于单一视角下数据信息的挖掘。因此,本次选题的意义旨在探索实现不同视角下各类数据的回归度量学习以及如何通过人机协同的方式降低大规模数据的标注成本。
  针对多视角与人机协同的关系对齐度量学习问题,本文从两个方面分别提出了度量学习方法。主要包括:多视角数据关系对齐回归度量学习方法,基于人机协同的度量学习方法。本文的主要研究成果和创新性工作有如下几个方面:
  1.受模式识别中的稀疏编码方式的启发,我们采用了字典学习的方式对多视角数据进行联合学习。在编码阶段,每一个视角下的特征由相关的字典表示,并对其采用联合正则的约束,增强了不同特征之间的关联性。通过联合学习得到一个通用的马氏距离的矩阵,来对数据进行分类处理。每种视角对于分类结果影响程度不同,所以我们在整合多视角数据的时候可以对得到的距离结果综合考虑,得到最为优化的分类结果。
  2.我们方法的前提是基于一个已有的完整标记的小型数据库。我们使用这些小部分已标记数据训练一个初步的度量学习模型和支持向量机(SVM)的模型,在处理未标记数据时使用SVM筛选出一小部分模型最难分辨的样本,通过人工标记难度较高的样本来改进学习模型。最终通过多次迭代,以少量人工成本标记完未知数据。
其他文献
双受精是被子植物发育的标志性事件,在双子叶植物的双受精过程中一个精细胞与卵细胞融合形成合子,经过一系列的细胞分裂与分化发育为胚胎直至形成种子;另一个精子与中央细胞融合形成胚乳,其间经历了合胞体和细胞化阶段,它为胚胎发育提供营养,直至发育晚期降解并消失。早期胚胎发生形成了植物基本组织的前体,在过去数十年中,科学家们对拟南芥胚胎发育的机制进行了深入研究,发现其胚胎发生和模式建成的过程是高度程序化的,这
研究背景:  已知胚胎心脏发育早期,来自心外的前体细胞经原始心管动脉端和静脉端不断迁入心内,并在相关转录因子或信号分子的调控下,向工作心肌或传导系心肌分化,参与心脏四腔室及中枢传导系和周围传导系的发育。研究表明第二生心区(SHF)心脏前体细胞可经心背系膜向心管内迁移,参与形成流出道、右心室、部分心房及房间隔、心房背侧间充质突以及主动脉和肺动脉干的发育。胰岛素增强子结合蛋白1(insulin gen
学位
直接甲醇燃料电池(DMFC)被认为是21世纪最有潜力的电动汽车动力源。作者对电动车用DMFC阳极流道内的甲醇.水溶液、CO气体两相流动,DMFC电池堆的热管理进行了深入的探讨,并参与设计、组装、运行了一个DMFC性能测试系统实验台。本文将DMFC阳极流道中伴随有流道.扩散层界面上的气液质量迁移过程的两相流动与传统加热管中的流动沸腾现象进行了类比,利用“拟沸腾.”的概念,建立了DMFC阳极两相流的物
该论文作为国际空间合作项目"双星计划"中的一个预研项目,主要是对卫星处理系统中的数据接收部分进行研究,研制出能够满足卫星高速数据下传要求的数据采集和存储系统,使应用于空间环境中的卫星能够实时高速地下传数据和图像,以适应日益增大的数据量需求.该论文以PCI总线技术为基础,研究了基于PCI总线的高速数据采集及存储系统的原理、组成以及在Windows 2000环境下进行数据采集和存储的方法.整个设计工作
学位
PCI
近年来随着MEMS惯性传感器的出现,使MEMS双轴旋转调制惯导系统成为热门研究内容。本文研究了MEMS双轴旋转调制惯导系统对准及系统算法的设计,并将算法移植到导航计算机中。  首先,对惯性导航系统更新算法进行了深入研究。根据MEMS惯性测量单元输出的角速率和比力信息,提出了基于角速率插值的等效旋转矢量法、基于角速率和比力插值的划桨效应补偿算法两种新的算法,通过仿真验证表明基于角速率插值的等效旋转矢
我国是世界上最大的蔬菜种植国家,蔬菜种植业逐渐成为农民脱贫致富的途径之一。在蔬菜种植过程中病虫害种类繁多,发生规律复杂,广大菜农多依靠主观判断进行病虫害防治,误判率高导致病虫害不能够及时准确的防治,直接影响蔬菜品质和产量,造成巨大的经济损失。随着农业科技的快速发展,要求温室大棚为蔬菜生长提供更加科学的生长环境,根据不同蔬菜不同生长阶段所需养分进行智能施肥。基于以上问题本文研究设计了一种基于图像识别
学位
为了方便寻找遗失的学生“一卡通”,我们构建了一个用于查找和丢失学生校园“一卡通”的平台。该项目需要从用手机相机拍摄的图片中检测文本和图像,提取信息并将其与机构的数据库信息进行匹配。在这种情况下,识别文字和图片将是核心工作。捕获图片后,将对其进行预处理,特征提取以及最终的字符识别。对于此项目,光学字符识别(OCR)用于检测卡上的信息。OCR在各种有限的问题领域中识别效果很好,但是,在设计高精度的OC
互联网和社交媒体的急剧增长促进了复杂网络相关研究的快速发展,近年来一种有效的网络分析方法:网络表示学习受到了广泛的关注,网络表示学习旨在学习节点的低维稠密向量表示,然而传统的网络表示学习方法不能直接应用到符号网络中,目前专门针对符号网络提出的表示学习方法也仅仅考虑了符号网络的结构平衡理论,但是对于在现实世界中广泛存在的有向符号网络而言,Status理论往往比结构平衡理论更加适合。因此本文利用了St
学位
在不可信中继网络中,中继节点被看做是?个具有较低可信度的节点,数据在传输时需要对其保密,而从信息论?度出发的物理层安全则可以有效的做到在保证协作的同时对中继节点保密。本?主要研究了不可信中继?络下的物理层安全,提出了两种不可信中继?络的中继转发策略,其中包括:容错解码转发(decode-and-forward relay networks allowing intra-link errors,DF
在社会心理学研究中,自我报告评估和内隐联想测验分别被用于测量群体的外显态度和内隐态度,但是这两种方法都需要被试人员地主动配合,并且只能进行小规模的群体态度测量。在社会媒体中用户所发表的言论可以反映用户的态度,但是当前的文本态度分析方法并没有对群体的外显态度和内隐态度进行区分。  受到社会心理学态度测量方法的启发,本文旨在研究一种自动化方法用于测量和区分大规模群体的外显态度和内隐态度,而不再局限于小