【摘 要】
:
随着信息技术和互联网的飞速发展,人们可以从多个信息源获得数据,即多源数据。由于多源数据具有类型多样、尺度不统一等特点,对多源数据进行汇聚并提取有效信息是机器学习和
论文部分内容阅读
随着信息技术和互联网的飞速发展,人们可以从多个信息源获得数据,即多源数据。由于多源数据具有类型多样、尺度不统一等特点,对多源数据进行汇聚并提取有效信息是机器学习和模式识别等领域研究的热点。由于多流形学习能够有效地揭示复杂数据中的内在结构,因此本文主要利用多流形模型对多源数据汇聚中的边界检测问题、鲁棒性问题和自适应性问题展开研究。本文主要工作包括如下三个方面:提出了基于边界检测的多流形学习算法。该算法通过检测流形的边界点来划分数据的多流形结构,并利用流形间的边界点与距离最远点来保持数据的整体几何结构。在人工数据集和真实数据集上的实验证明,基于边界检测的多流形学习算法在流形间相对分离的数据上有较好的识别效果。提出了多源数据鲁棒谱多流形学习算法。该算法首先通过降噪投影矩阵对原始数据进行提纯;再利用混合主成分分析模型将相交多流形分成若干个“不相交块”,根据样本局部近邻切空间对每一源数据构建相似度矩阵;最后将各源相似度矩阵进行汇聚,实现对多源数据的识别。在单源数据集和多源数据集上的实验表明,该算法相较于其他算法有更好的识别能力和鲁棒性。提出了多源数据非负自适应多流形学习算法。传统多源数据学习算法在进行多源数据汇聚时需要引入超参数确定各源数据的权重。该算法将每一源数据看作一个流形,通过自适应的方式更新各源数据的权重和近邻矩阵,更准确地表示数据的流形结构。最后将各源数据的近邻矩阵进行汇聚,得到一致自适应相似度矩阵。该算法充分利用了多源数据的互补性与一致性,提升了学习性能。
其他文献
以贡嘎山海拔2900~3100m的暗针叶林生态系统为研究对象,分析了大气降水在穿透雨、树干径流、苔藓、土壤和地下水各个过程中干湿季和年际间离子含量变化特点。结果表明:(1)树干径
目的:研究苯扎贝特降血脂治疗外的抗动脉粥样硬化作用。方法:将58例高甘油三脂(TG)血症患者随机分为苯扎贝特组和对照组。苯扎贝特200mgTid治疗2个月与对照组比较空腹血甘油
超声技术在根管治疗中的良好效果以及在根管治疗中多方面的应用,使许多过去难以进行的治疗变为可能,使原来的治疗变得简便、省力,提高了根管治疗的水平.
泰克公司日前宣布,数字高清互动视音接口(DiiVA)联盟将采用泰克的测试测量解决方案,为领先的消费电子制造商进行一致性测试验证。作为第一个、也是目前唯一为该标准提供物理层测
HAV-HEV 5种嗜肝病毒发现和采取严格的预防措施后仍有不明原因的肝炎发生和流行,10 a来进行了大量寻找新肝炎病毒的工作,但对其致病性至今仍为定论.于是近年又有不少学者深入
改革开放以来,我国物价发生较大变动,通货膨胀率居高不下,现今经济面临下行压力。但是迄今为止,我国还没有类似于国际会计准则的物价变动会计规范,企业对此还未建立准确的会计核算
以景观生态理论为基础,配合水文现象的变化,应用统计分析技术计算各种景观生态指标,生态意涵在不同时期上之变异与能量循环上之改变及其生态代表意义,结果显示嵌块体的聚合大多由
据中新网北京电,7月8日,自治区商务厅和桂林市政府联合在北京举办了一个座谈会,座谈的话题是桂林米粉,重点则是“要把桂林米粉‘煮’成什么样”。$$按照参会的桂林市政府领导的介
目的:在细胞生物学、分子生物学和免疫学等众多基础学科发展的基础上,总结角膜外伤、炎症、感染等多种疾病共同病理改变的角膜新生血管的调控机制及治疗新方法,以期对角膜新
目的:观察 HD02对新生大鼠体外培养神经干细胞( neural stem cell,NSC)增殖、分化和凋亡的影响. 方法:分离、培养新生大鼠海马 NSC,采用免疫荧光双标技术检测 NSC增殖分化,流