基于高斯过程的特征提取研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:philippetr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对高维空间中的数据进行分类、压缩、和可视化是比较困难的,其主要难题在于要找到一种维数减少的数据来代表高维的原始数据。本文中,我们探讨用一种实用性比较强的贝叶斯方法来进行特征提取。主要是应用高斯过程潜变量模型(GPLVM)来解决数据降维问题。Matlab实现用的数据是一组52维基因表达数据集。本文将阐述高斯过程潜变量模型作为一个概率降维方法如何能够找到高维数据和低维流形结构之间的非线性映射。用Matlab对数据集进行特征提取实验,首先是用(GPLVM)进行降维,然后用(PCA)做比较。在本论文中,我们系统地介绍和讨论了高斯过程作为一个可以减少变量(特征)数目的降维工具,数据降维通常分为两个部分:特征选择和特征提取。数据降维方法可以理解为对数据进行预处理然后再用其他的算法进行其他的任务,这样可以有效地减少数据处理过程中的计算量和防止维数灾难的发生。本文的第一章做了一个概述,简单的介绍了研究意义和背景,讨论了为什么我们需要把有意义的特征提取出来,并丢弃其他无关紧要的特征,我们也介绍了一些目前比较常用的特征提取方法,例如独立分量分析(ICA)和主成分分析(PCA),主成份分析的主要思想是把高维空间的数据点投影到低维空间中去,同时保持尽可能多的原来信息。第二章介绍了关于高斯过程和特征提取一些基本知识和概念,如GP的分类,近似和内核函数,以及如何选择特征的预备本知识。第三章是这篇论文中主要工作所在,重点讨论了潜变量模型与其在减少数据集维数的使用,对高斯过程潜变量模型做出了详细的说明并且给出了其必要的数学背景,例如高斯过程潜变量模型如何进行降维等等。高斯过程潜变量模型是一种无监督非线性降维方法,类似于PPCA、MDS、GTM等方法,GPLVM使用高斯过程建立从低维隐空间到高维空间的映射关系,通过最大化观测数据的联合密度,优化出高维数据在隐变量空间中的坐标位置,从而达到特征提取目的。本文的最后一章对癌症药物成分数据所做的实验工作进行了阐述,介绍了实验数据,给出了实验结果以证明高斯过程潜变量模型降维方法的有效性,对实验结果也做出了分析。本文用Matlab软件实现了降维算法并在数据上进行了实验,以验证算法的优势,随后也用了PCA方法对同样的数据集做了实验,本论文突出了高斯过程潜变量模型作为一个无监督的概率降维方法的特点。最后对本论文的内容进行了总结与讨论。
其他文献
残障不仅是一种生理现象,也可被理解为一种社会经验。为了反抗残障的生物医学话语,社会学内部诸多理论传统通过不同的研究范式来解释残障现象。本文理清和呈现不同理论传统中
环境纳米技术强调了解在自然界发生物理/化学多样性的广大环境下的纳米结构的分布、组成、起源和行为,而作为环境纳米科学中的纳米结构的生物矿化研究是近年来多学科交叉研究的
电力变压器是电力系统的重要组成部分,其运行状态对电力系统安全、稳定和经济运行有重要意义。因此对其进行故障诊断,提高运行的可靠性,是十分必要的。本文在参考《电力设备
目的:痛经是指妇女经期或行经前后出现的周期性小腹疼痛,分为原发性和继发性痛经,是临床上常见的妇科病。针灸治疗本病疗效较好,无副作用,见效快.本研究通过分析原发性痛经的
暂缓起诉在国外司法实践中是一项刑事诉讼制度,是起诉便宜主义的一种表现形式。该项制度在欧美、日本及我国台湾等地广泛适用。我国尚未确立该项制度。但近几年,我国部分地区
纪检监察派驻机构作为我国的纪检监察体制的重要组成部分,在预防腐败、强化监督等方面发挥着重要作用。但由于制度的设计和实际运行中的种种牵绊,派驻机构在独立性、权威性、
<正>1 组织引导性再生(Guided Tissue Regeneration、GTR)的概念。 早在1957年,Mnrray等在狗髂骨的洞形缺损上覆盖塑料网架,造成骨缺损内大量新生骨的生长,甚至超出了髂骨平
作为当代高校教学的重点力量,辅导员也成为推进高校教学建设专业化的代表。为了进一步提升高校辅导员管理和建设质量,需要高校采取以下手段和措施,加强培训和管理,提升高校辅
《考古与文物》是在呼唤科学、发展经济的大背景下诞生的。1978年,陕西省考古研究所重新恢复建制,为促进考古成果的快速发表及培养人才,拟办一份文物考古类的学术期刊的议题也被
蒂森克虏伯股份公司是蒂森克虏伯集团母公司。蒂森克虏伯股份公司执行委员会负责公司和集团的管理。这其中首先包括确定企业战略、配置资源和行政、财务管理。根据德国商法典