基于流形结构的相对尺度化降维方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:siyang2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现今这样一个信息爆炸的时代,数据降维处理方法的研究占据了现代数据科学领域中一个非常重要的位置。随着现代数据规模与维度的不断增加,无论是在数据的除噪、精炼,还是高维数据的可视化分析领域,数据降维算法都具有极大的实用意义。而随着时代不断演进,数据降维算法也衍生出了种类繁杂的各种分支。其中,Isomap算法作为非线性降维(流形学习)类算法中最为经典的方法,因其在解决数据非线性结构上的创造性工作,受到了学者、与数据科学界的广泛应用与关注。Isomap算法的核心在于通过数据局部连通图上的最短路算法来模拟流形内部的距离,从而成功地摆脱了传统算法中隐含的欧式空间假设,达到了更为真实刻画流形内部结构的目的。但是,由于Isomap算法最后采取了经典的MDS算法作为求解最后一步的方法,而在降维时,MDS算法希望保持的是距离的绝对值的差最小,随着问题规模的增长,它的计算结果往往会导致局部结构的扭曲。本文针对这一问题,提出了新的相对化目标函数,使得远场信息与近场信息能够有一个较好的权衡。同时,我们通过一些比较经典的算例上的计算,希望在发掘原有Isomap算法不足的同时,能够达到更为真实地还原流形局部的结构的效果。同时,由于算法的目标更改,算法的求解需要通过数值算法完成,本文也给出了一些求解过程中的技巧,并且引入了Landmark思想,降低求解的复杂度,希望能够比较高效地得到算法收敛结果。
其他文献
研究区出露有大面积早元古代基性-超基性岩,具有找寻铜镍硫化物矿的前景,然而对于研究区并未进行系统的地质勘查工作,对超基性岩体的分布特征和成矿特征等情况的了解仍是严重
中国文学外译是中国文化“走出去”战略的重要路径之一。西方汉学家作为译介中国文学的重要力量,对中国文学的海外传播做出了巨大贡献。同时,由于译文中存在大量对中国文化的有意或无意的误译,其翻译成就也受到诸多学者质疑。无论是忠于原文还是误读误译,译文本的生成受译者主体性、外部环境、读者和出版社等多种因素影响。事件哲学理论(Event Philosophy)近年来在文化研究中呈上升趋势,它强调事物发展过程中
随着计算机技术的发展和Web2.0时代的到来,尤其是近期互联网+概念的提出,互联网应用已经覆盖到了人们生活的每一个角落。社交网络服务(Social Network Service/Site,SNS)作为互
油气资源一直以来都是我们的战略能源,在资源体系中的地位也越来越重要,但是随我国各能源区块勘探开发力度加大,井越来越深,岩石的硬度和塑性增大,可钻性较差,岩性的变化加大
研究区大地构造位置处于华北板块Ⅲ、华北板块北部大陆边缘Ⅲ1,宝音图-锡林浩特火山型被动陆缘Ⅲ11,锡林浩特地块Ⅲ11-3;隶属于内蒙古-大兴安岭成矿省(Ⅱ-2),乌力吉-锡林浩特
目的:1.研究蒙古国希日嘎拉照图75号温泉和内蒙古敖汉温泉水的理化性质。2.确定蒙医温泉嗜热菌群的菌属及分类、纯化繁殖条件、物质代谢、生物活性及优势菌群。3.了解分离嗜热菌的方法,确定其医疗作用,给日后工业,医疗提供基础。方法:1.对希日嘎拉照图和敖汉温泉做系统的野外调查,用GPS定位所处位置。2.取希日嘎拉照图75号温泉和敖汉温泉水,用GB 8537-2008和GB 8537-2016测温泉水微
关于蛋白质的折叠机理一直困扰科学界的一个生物难题。蛋白质是生物细胞的重要组成部分,它不仅参与了生物体内的各种生物化学过程,还能够维持生物体的生长发育和新陈代谢。蛋
随着网络新业务不断出现和贪得无厌的带宽需求,网络处理器NP(network processor)的开发成本日益增加。基于传统的硬件开发流程设计NP使得其性能分析只有在硬件实现之后才能进
传统有机荧光染料的光稳定性较差,容易发生淬灭等缺点给标记应用相关研究工作带来很多的不便,因而,寻找新型的荧光材料成为研究的热点。近年来,具备良好荧光特性的量子点在标
引入惯例概念以来,惯例就被认为是组织完成工作的主要手段,组织惯例是影响企业生存发展的关键因素,探究惯例变异的影响因素对企业生存发展至关重要。情感是一个复杂的心理范