流形学习的理论与方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：wsq27028320

【摘要】

：

科学的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。在信息时代的科学研究过程中,不可避免的会遇到大量的高维数据,如全球气候模型、图像分类系统、文本聚类

【作者】

：

王靖

【出处】

：

浙江大学

【发表日期】

：

2004年期

【关键词】

：

重构权局部切空间排列自适应邻域选取减少偏差曲率和切空间

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

科学的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。在信息时代的科学研究过程中,不可避免的会遇到大量的高维数据,如全球气候模型、图像分类系统、文本聚类和基因序列的建模等。在实际应用中,用高维数据来表示的观测点可以模拟成可能带有噪音的低维非线性流形上的样本点或者逼近这些样本点。因此,数据降维尤其是非线性降维成为数据挖掘的一个重要手段,进行降维的目的是为了从高维空间中找出隐藏的低维结构。过去几年来,非线性降维在包括数据挖掘、机器学习、图像分析和计算机视觉等许多研究领域都吸引了广泛的关注。最近,已经发展出一些有效的算法来进行非线性降维。这些算法包括等距映射(Isomap)、局部线性嵌入(LLE)以及它的变换形式:海赛局部线性嵌入(HLLE)和局部切空间排列(LTSA)等。所有的这些算法都有一个共同的特征:找出每个数据点周围的局部性质以及采用这些所收集到的局部性质信息将流形非线性的映射到一个低维的空间中。然而,这些算法的实现在收集邻域的局部信息以及采用这些收集的局部信息构造全局的嵌入上都是不同的。比如,Isomap利用每个邻域的邻域点之间的联系和欧氏距离在数据点上构造出一个图,并根据图距离来估计出所有数据点之间的测地距离。构造出的全局低维坐标需要保持估计的测地距离。LLE找出每个点同它的邻域点之间的一个线性组合关系,并且由此决定保持这种线性组合结构的低维嵌入。LTSA将每个点的邻域点投影到它在流形上的局部切空间上,然后排列所有的局部坐标来决定低维的全局坐标。显然的,局部几何结构的恢复效率决定了这些算法的效率。 LLE是流形学习方面经典的局部非线性方法,它有参数少、计算快、易求全局最优解等优点,并在图像分类、图像识别、谱重建、数据可视化等方面都有着广泛的应用。但是,LLE可能会将相隔较远的点映射到低维空间中邻近点的位置,从而导致嵌入结果有着比较明显的扭曲。这其中的一个重要原因是,LLE采用的单个重构权并不能完全的反映出流形的局部几何性质。此外,用以求解重构权的有约束的最小二乘问题的最优解也许不是唯一的,而且LLE采用正则化方法求解涉及到正则因子γ的选取,难以保证所求的解是最优解。这些都是LLE所面临的问题。有一些共同的因素影响着流形学习方法的效果。流形学习方法首先面临的是邻域选取的问题,需要选取出一个合适的邻域以获取局部的线性信息,邻域选取的结果直接影响着最终的嵌入结果。很显然的,邻域越小可以认为邻域的线性结构越明显,但是我们

其他文献

纳米铜薄膜氧化反应动力学规律研究

研究了140℃下纳米尺度Cu薄膜的氧化行为．采用真空蒸发法以不同沉积速率制备一系列Cu薄膜，利用原子力显微镜（AFM）观察其微观形貌，选取形貌良好的Cu薄膜样品．采用方块电阻和透射光谱

期刊

铜薄膜氧化动力学表征方块电阻透射光谱

文化视角观照下的赣南民间舞蹈

赣南散落着种类繁多、形态丰富、特色鲜明的民间舞蹈。本文以赣南民间舞蹈为研究对象,从艺术人类学视角,结合典型个案分析,揭示赣南民间舞蹈依附的社会框架和蕴含的文化本质,

期刊

生成环境文化本质理想表达

割麦

九月的阳光说毒也毒得狠,远远望去,麦田里仿佛有热气在蒸腾。人,弯腰在那片金黄中,如同一叶小舟。这片苍茫的麦海中,只有一个我,还有我的爸爸和妈妈。布谷声声,麦香阵阵。割

期刊

前弓后蹬片金小舟麦香就是你回过头三堆真切体会指导教师

自引发光固化丙烯酸酯二氧化硅复合材料

自引发光固化材料不需要添加小分子光引发剂,可以大幅降低光引发剂的残留及其对环境的危害;制备丙烯酸酯/复合材料是增强光固化涂料耐磨性、热稳定性和机械性能的有效手段.本

会议

光引发剂复合材料丙烯酸酯二氧化硅

益气活血复方干预家兔动脉粥样硬化的抗炎稳斑作用机理研究

目的:本实验研究通过建立新西兰白兔AS动物模型,观察益气活血复方对AS白兔抗炎稳斑的作用机理,检测和动脉粥样硬化相关指标血脂、NF-κB、VCAM-1、MCP-1、内皮因子及纤溶系统

学位

益气活血复方动脉粥样硬化VCAM-1、MCP-1NF-KB

河北省为企业技能人才重奖普级

今后，河北省将每两年评选一次“燕赵技能大奖”、“燕赵金牌技师”和“河北省技术能手”，以加强对高技能人才的表彰。其中：技能大奖每次10名，金牌技师每次100名，技术能手每次100名

期刊

高技能人才河北省重奖企业技术能手技师金牌

今天你抱怨了吗

勇往向前：有副对联，上联是“恨爹不成刚”，下联是“怨爸不双江”。陌上花开；呵呵，这可是令人羡慕的“名爹”啊!

期刊

抱怨压力工作生活

加大监管工作力度提高食品安全水平

近日，中共中央政治局常委、国务院副总理、国务院食品安全委员会主任李克强主持召开国务院食品安全委员会全体会议并讲话。他强调，要深入贯彻落实科学发展观和《食品安全法》。

期刊

食品安全委员会监管工作安全水平力度中共中央政治局常委国务院副总理《食品安全法》人民群众

做人底线有“天”看

一杆老锵：说起这个话题，我真的有点儿悲哀，当今社会，不要说什么远大理想，高尚道德，就是做人的底线，有些人都坚持不住了，那先请两位唠唠对于做人底线的理解。

期刊

做人“天”线社会

农业物料电磁特性的研究与应用

综述了目前国内外对于农业物料电磁特性的研究与应用情况.介绍了高压脉冲电场的应用及其试验装置的设计,并对静电技术和等离子体技术在农业工程领域中的应用作了较为详尽的阐

期刊

农业物料电特性磁特性应用agricultural materials electric properties magnetic properties

流形学习的理论与方法研究

与本文相关的学术论文