基于自表达的多视角主动学习的研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:seacowo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体和数据存储领域的技术进步极大的提升了网络技术的应用范围,大量数据产生并被记录下来从而产生了大数据的概念,如何从海量大数据中发掘数据的价值,利用数据的价值成为了计算机科学研究的一个热点。多视角数据是指对同一事物从不同视角或者渠道获取的数据,是描述同一事物的不同表现形式,多视角数据在现实世界中普遍存在。传统的监督学习任务是从一个已有标记的数据集通常称为训练集出发,通过对于此数据集的学习而得出一个数学模型。而在众多实际的应用中,标注一个样本集的代价高昂,与此同时,获取未被标注的样例则相对容易低廉。如果使用传统监督学习算法来学习一个分类准确率满足规定准确率的学习器会非常困难。因此,主动学习的概念被提出用以解决上述问题,一个主动学习算法可以主动地挑选信息含量丰富的无标记样例,然后将此样例(集)提交给领域专家标记再放入训练集供学习器学习。通过这种策略可以在训练数据集相对小的情况下得到一个分类性能较好的学习器,从而有效地降低了构建高性能分类器的代价。针对当前主动学习的问题:多视角信息利用不足,早期实验设计算法缺少。本文提出了两种基于自表达的多视角(多模态)主动学习的方法。研究成果和创新点具体体现在以下几个方面:1.对于早期实验设计的多视角主动学习的意义进行了研究。2.提出了一种新的方法,称为多视角的代表性和信息性诱导主动学习(MRI-AL),本方法利用多视图学习来选择代表性和信息性共存的样本点来进行标记。3.提出了一种新的方法,称为基于灰(Dirty)表达的多视角主动学习(DMAL),本方法利用灰表达的思想针对多视图来选择代表性的样本点来标记同时利用稀疏编码和子空间重构技术来保证样本点的代表性,同时用灰表达的特性来去除表达样本中的冗余样本数据。上述方法在不同的多视角数据集上进行验证后,相比其他的早期的主动学习的方法取得了明显的效果提升。两种方法从不同的角度提出了不同解决办法,性能上,DMAL优于MRI-AL。
其他文献
MIMO(Multiple-Input Multiple-Output)雷达以其空间分集和波形分集等优势成为雷达领域中的研究热点。MIMO雷达使用多个发射天线发射分集波形,匹配滤波器在每个接收阵元处分
目的观察改良化学性迷路切除对顽固性梅尼埃病的远期疗效。方法回顾分析22例顽固性梅尼埃病患者的临床资料。所有患者术前经过正规保守治疗无效,主要症状为频繁发作性眩晕,伴
阴阳网格是一种准均匀重叠网格,能够有效避免传统经纬度网格的极点奇异性和经线在极区辐合的问题,但是由于阴阳网格不能自然保证物理量的守恒性,因此,阴阳网格上的质量守恒算
本文选取“军事道德战研究”为题,在收集相关背景资料、研读的基础上,通过归纳总结,对道德服务军事功能进行探索,进而对于当前道德战研究提供一定的经验与启示,并对道德战在
陆地生态系统碳循环是当今全球变化的热点问题之一。陆地生态系统总初级生产力(Gross Primary Productivity,GPP)是碳循环过程中的重要组成部分,表征了植被通过光合作用固定碳
线粒体基因与核基因组相比,具有拷贝数高、分子量小、结构保守、缺乏基因重组、进化速率快和母系遗传等特点。这使得线粒体基因组不仅成为研究系统发育的有力工具,也是唯一可
人力资本是通过对人的投资形成的,不仅包括对知识、技术、能力的投资,更重要的是对健康的投资。健康人力资本对经济增长有推动作用,而视力健康是健康的重要一环,视力健康问题
光纤陀螺作为应用在惯性导航系统中的一种角速率敏感器,具有无转动器件、启动时间短、抗振动冲击能力强、成本低、寿命长、动态范围大等优点,因此已经被广泛应用于军事和民用
背景眼睛晶状体(lens)是一个高度透明的器官,它在整个生命过程中是不断生长的。其发育过程为上皮细胞不断分化为细长的纤维细胞,这些纤维细胞层层覆盖在同心层上,并且去除细
由于汽车的广泛普及与无人驾驶的深入研究,道路交通安全、拥堵问题等日趋严重。车辆自组网(VehicularAd-hoc Networks,VANETs)在辅助驾驶、安全告警和路况实时监测等方面发挥