【摘 要】
:
随着科学的进步,信息技术得到了快速发展及广泛应用,高维数据应运而生,如医学图像处理、计算生物学、全球气候模型等,高维数据难以被现有的机器学习和数据挖掘算法进行有效地
论文部分内容阅读
随着科学的进步,信息技术得到了快速发展及广泛应用,高维数据应运而生,如医学图像处理、计算生物学、全球气候模型等,高维数据难以被现有的机器学习和数据挖掘算法进行有效地处理。数据降维算法是处理这些高维数据的一个非常重要的工具和方法。而流形学习作为一种高维数据降维的技术手段,在非线性降维方面取得了广泛的应用。其中局部线性嵌入(LLE)是一种假设局部能够线性化表示而提出的流形学习算法,它有参数少、计算快、易求全局最优解等优点。但是,LLE算法使得降维后的数据损失了原有数据的密度信息,从而导致降维效果产生扭曲,无法获得正确的低维嵌入。另外,多流形数据不满足局部线性嵌入算法要求流形连续的特点,所以也难以有效降维。这两个问题成为了局部线性嵌入的瓶颈。本文主要对基于流形学习的局部线性嵌入(LLE)算法进行了深入的研究与改进,对LLE的缺点进行了详细地分析:(1)在源数据集分布不均匀、密度变化大的情况下,分析了LLE算法降维的基本思想,得出权值矩阵在降维过程中起到了连接枢纽的重要作用,而近邻的选取对权值矩阵的获得具有直接的影响。因此,一方面从局部近邻的几何性质入手,对近邻选取情况进行改进,另一方面对LLE权向量的性质进行了详细的分析,得知降维后的数据不能反映原来高维数据的密度信息。在以上基础上提出了一种基于密度刻画的降维方法。(2)对多流形问题进行了研究,发现多流形数据存在局域线性化差的问题,从局部线性嵌入算法的两个独立的优化问题入手,对LLE算法进行改进,提出了一种基于局部线性嵌入的多流形学习算法。
其他文献
Web2.0时代到来后,大数据时代接踵而至,微博等社交媒体越来越受到社会和研究者们的高度关注,面向微博应用的相关任务以及评测也在逐年增加。文本自动摘要主要是通过计算机自
为了解决定性的观察手段带给新型黑硅微纳加工工艺开发的桎梏;为了给新型微纳加工工艺提供有效的定量的验证手段;为了给进一步研究微纳加工技术新理论,建立集成微纳制造技术的理
随着网络防御技术的不断发展,网络攻击技术也在不断升级。一方面,不断涌现出已知攻击类型的变种使得传统的入侵检测系统(IDS)难以发现;另一方面,近三年来更是出现了一些被传
随着智能视频监控系统的高速发展,近年来,人们对视频监控系统的智能性要求日益提高。多摄像头网络能够监控更广阔的区域,正在逐渐被重视。但是,由于经济、资源等方面的考虑,不太可
随着信息技术的发展,Web应用方式越来越受到用户的青睐。Web应用软件规模越来越大,构架越来越复杂,开发人员需要通过性能测试了解系统运行过程中的性能表现与资源消耗模式。性能
进入到21世纪后,SARS和甲型H1N1流感相继在全世界范围大规模爆发,人民的生命财产安全受到严重威胁,我们面临的形势十分严峻。国内外很多专家学者在传染病预测方面做了大量的研究
随着计算机在当前社会各行各业的广泛应用和Internet的飞速发展,网上的信息量呈几何级的飞速增长。本体作为一种能从知识和语义层次上表达信息的工具模型引起了重视。由于本
随着出版业与互联网的不断发展,读物领域的信息爆炸现象日益突出,如何帮助用户在大量读物中找到喜欢的读物成为亟待解决的问题。因此,能够帮助用户快速找到感兴趣读物的读物推荐
随着软件系统规模的不断增长,如何为软件开发过程提供高质量的软件需求规格说明日益受到业内人士的重视。业内研究人员不断探寻合理评价软件需求文档质量的模型和方法,期望能
随着我国经济与科学技术的发展,业主对住宅质量、生活质量的要求也越来越高。业主逐渐开始关心居住周边环境、安全卫生、信息流通、物业管理等方面。可见在不久的将来,新的由计