健壮的流形学习算法及其应用研究

来源 :福建师范大学 | 被引量 : 3次 | 上传用户:BBP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界的数据往往具有较高维度,直接应用传统数据挖掘技术将面临“维灾”问题。因此,研究有效的降维算法,寻求在低维上进行数据分析,成为数据挖掘研究热点。但是,许多传统降维算法只针对线性分布数据,无法满足现实中大量非线性分布数据的分析需求。而流形学习算法作为一种非线性降维工具,在非线性数据可视化及分类性能上有较大优势,在许多领域得到了广泛的应用。然而,流形学习算法仍存在一些不足,尤其是对噪音的敏感性,成为影响流形学习算法更广泛应用的瓶颈。因此,研究健壮流形学习算法成为迫切需求。本文首先总结了许多现有的优秀流形学习算法,详细分析了算法存在的缺陷,然后分别基于去除及抑制噪音的思想,提出基于局部相关维度的噪音流形学习算法、基于核函数与监督学习的流形学习算法、基于共享近邻的非线性降维算法三种算法。分别从除噪、监督学习、无监督学习三个方面入手,研究能适应不同应用场景的健壮流形学习算法。在人工数据与UCI数据上的实验表明,我们提出的方案较原始算法在精确率上有较大提高,是有效的非线性降维工具。最后,我们将算法应用在白血病细胞的光谱数据分类上,辅助临床研究:同时,还进行医院绩效考核领域方面的应用研究。实验结果表明,我们的算法在现实中可以成功应用,具有可行性和借鉴意义。
其他文献
可重构技术是一种全新的数字电路设计模式,既保留了硬件计算速度快、效率高的优点,又兼具了软件灵活、开发周期短和易维护的特点,成为了目前计算系统领域的研究热点。动态局部可
现代医学影像学为人们提供了多种模态的医学图像(如CT,MR,PET等),不同模态的图像提供了人体的不同信息。通过医学图像融合技术可以把不同模态图像的有用信息融合在一起,形成
学位
随着网络的日益普及和电子商务的快速发展,信息推荐实现了从传统的“人找信息”向“信息找人”的网络服务模式的转变。协同过滤技术是当前推荐系统主要采用的技术,它能够发掘
随着信息科技的进步和通信技术的不断发展,计算机技术已发展到以网络为中心的信息交互时代。网络服务站点也不再局限于提供HTTP、FTP等传统类型的服务,新的服务类型如流媒体
数据仓库和数据挖掘技术是信息技术研究的热点问题之一。数据仓库是一个支持管理决策过程的、面向主题的、随时间而变的数据集合,它是集成的,也是稳定的。数据挖掘是采用人工智
目前电子商务网站数量众多,信息资源总量庞杂、增长速度飞快,导致用户在整个商品空间上出现信息迷航和信息过载问题,信息使用效率降低。现有的电子商务网站搜索系统和搜索引
国际电信联盟(ITU)表示,2009年底,全球手机用户数量已经达到46亿,而到今年年底,全球手机用户数量将达到50亿。虽然全球经济经历了低迷阶段,但是用户对通信服务的需求仍在提升
随着信息技术的快速发展,软件的应用变得越来越广泛。软件规模越来越大、功能的增强和复杂度的增加使得软件的成本、进度和质量变得难以控制,这些问题己经日益成为人们关注的焦
伴随着Web Services技术在信息技术各个领域内的广泛应用,基于Web Services技术的Web服务的可用性、可靠性和稳定性成为了服务提供商和服务使用者普遍关注的焦点,服务提供商