【摘 要】
:
随着数据采集技术的不断发展,人们获得的数据常常具有多个视角,形成多视图数据,如何有效利用多视图数据进行高效学习是一项具有挑战性的工作。本文研究了多视图数据上的迁移
论文部分内容阅读
随着数据采集技术的不断发展,人们获得的数据常常具有多个视角,形成多视图数据,如何有效利用多视图数据进行高效学习是一项具有挑战性的工作。本文研究了多视图数据上的迁移学习、数据降维以及聚类问题,并在现有的多视图学习方法基础上提出改进。首先,研究了多源多视图迁移学习算法并提出改进,给出了基于视图一致性的多视图迁移学习算法。该算法使用高斯混合模型代替高斯过程估算源域和目标域的密度比,更准确地描述了源域和目标域的分布差异。同时,通过在样本选择公式中添加预测差异项,选择更具标签一致性的源域样本,融入了多视图样本的标签一致性信息,因此改进后的算法提升了多视图数据的分类性能。其次,研究了多视图半监督降维方法,该方法通过最小化不同视图的差异性获得一致性低维表示,适用于多视图数据降维。由于该方法要求各视图数据必须完全一一配对,因此不能处理半配对数据降维问题。本文对多视图半监督降维方法做了改进,在计算不同视图差异性时只使用少量配对数据,避免强制配对带来的负作用。同时,为了获得更具可分性的一致性低维表示,对每个视图的转换矩阵进行稀疏化,给出了基于字典学习的稀疏多视图降维方法,该方法提升了多视图数据降维后的低维表示的分类性能。最后,研究了基于马尔科夫链的谱聚类算法,并分析了其存在的问题。针对该算法不能处理多视图聚类的问题,我们通过最大化不同视图的相似性,获得多视图数据的共享隐藏相似度矩阵。然而,经典的欧式距离度量不能正确反映不同视图的相似性,我们使用基于角度的相似性度量。此外,多视图数据中可能包含噪声干扰,如果不加处理会严重影响多视图聚类效果。为此,我们将每个视图的相似度矩阵分解为共享隐藏相似度矩阵和偏移误差矩阵,并对偏移误差矩阵施加稀疏约束。该方法有效利用了多视图数据的互补信息,提升了聚类性能。对于本文中所给出的改进算法,我们做了充分的实验,并说明了改进后的算法的有效性。
其他文献
随着人们对软件安全问题重视程度的提高,如何快速高效地检测出软件的安全漏洞已成为当前计算机安全领域研究的一个重要课题。本文针对一个C/C++程序的静态安全检查工具,设计
对等网络所面临的一个关键问题是如何更加有效地利用网络中的结点,避免负载失衡,从而更好地实现资源共享。本文针对基于DHT的结构化对等网络中由于热点引起的负载平衡问题,研
针对实际电网项目中SVG(Scalable Vector Graphics)图形格式与自定义GRC图形格式不兼容的问题,本课题提出了一种解决方案,实现了这两种图形格式之间的转换。课题首先分析了SV
工作流技术正在经历从刚性向柔性、动态性的变革,这种变革源自企业在发展过程中不断出现的许多新需求;过程实例在运行过程中发生与原过程定义的偏离,通常称为工作流变更或异
视频压缩是多媒体通信领域关键支撑技术之一,对多媒体技术的应用与发展起到至关重要的作用。由于广泛应用于高清领域,H.264/AVC在高分辨率下的实时解码实现对处理器计算能力
生物体内需要经过多种中间反应从营养物质转化成最终代谢产物。转化过程中,代谢反应过程却是错综复杂、多种途径并存的。从一个抽象的水平上看,细胞代谢可以被看成一个连接各
入侵检测是网络安全中一个新兴的,快速发展的并且极为重要的领域。它是动态网络安全技术最核心的技术之一,它不仅检测来自外部的入侵行为,同时也可以发现来自网络内部用户的未授
近年来,无线通信技术的发展和进步给无线传感器网络(WirelessSensor Networks,WSN)的应用提供了机遇和挑战。WSN这种集分布式处理能力、高监测精度探测能力、高容错能力、覆
随着处理数据的量级不断增大,传统的单计算节点的大型处理机已渐渐无法满足新时代的数据处理需求。并行与分布式系统则为这一问题提供了新的思路与解决方案。对于大型分布式
金属构件在焊接、冲压、铸造和其它许多加工中,均有可能形成残余应力。在许多情况下,残余应力的存在会对构件的机械性能产生极为不利的影响,因此残余应力的消除问题成为许多科学工作者研究的热点。传统的消除残余应力方法是自然时效和热时效。由于能源危机,60年代起人们开始研究振动时效。与传统时效方法相比,振动时效具有投资少、生产周期短、使用方便、节约能源等优点。传统的振动时效扫频判峰技术是时域扫频判峰方法,其缺