评估几种流行学习降维分类器应用于癌症数据的性能

被引量 : 3次 | 上传用户:cz1502008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量的高维癌症数据给我们带来了许多困扰,最显著特点之一就是维数多样本数相对较少。面对这样的高维数据,数据降维成了数据挖掘中必不可少的步骤。降维技术能够通过提取特征,保留局部结构降低维度,帮助机器学习作准确高效地分类。然而选择什么样的降维分类器才能达到最优的分类效果,是本文研究的中心内容。本文所论述的降维方法都是基于流行结构的,有线性降维方法:主成分分析(PCA)、Fisher线性判别分析(LDA)、多维尺度变换(MDS)、局部保留投影(LPP)、类别非局保留投影(CNLPP);非线性降维方法:局部线性嵌入(LLE)、拉普拉斯特征映射(LE)、等距映射(ISOMAP)。其中的局部保留投影,不仅具有保持数据集结构不变的非线性特点,而且具有线性方法计算简单、直接快捷的特点。在癌症数据的降维中表现出了优势。支持向量机(Support Vector Machine,简称SVM)是机器学习和统计学习理论中理论完备、全局优化性能、泛化性能较好的一种方法,满足了高维癌症数据小样本的特征。最近邻分类器(Nearest Neighbor Classifier,简称NNC)也是一种经典,简单的分类器,是实验中最常用的一种分类器。本文主要讨论降维方法与分类器相结合的结合式分类模型对5种癌症数据进行分类的效果比较。全文的主要内容概括如下:(1)概述了高维数据处理领域的发展状况及其所蕴含的一些问题。并对典型降维方法进行了分析,包括各自的算法、优缺点及研究现状。其中着重阐述了保局投影这种线性降维方法。(2)介绍了支持向量机的基本原理,及一般的分类流程。运用Matlab2009实现了SVM对癌症数据的二分类。(3)研究和比较SVM、NNC与一些降维技术相结合的分类模型在癌症数据分类中的性能,为相关的分类研究提供参考。本文所使用的结合式分类模型有:PCA-SVM、LDA—SVM、MDS—SVM、LPP—SVM、CNLPP—SVM、ISOMAP—SVM、LLE—SVM、 LE—SVM、PCA—NNC、LDA—NNC、MDS—NNC、LPP—NNC、CNLPP—NNC、ISOMAP—NNC、LLE—NNC、LE—NNC。实验结果显示LPP—SVM、CNLPP—SVM、LE—SVM有较好的分类效果。
其他文献
目的简述血必净注射液的主要成分、功能主治,重点讨论血必净注射液的主要药理作用和临床应用及评价。方法查阅近年来血必净注射液临床应用的相关研究文献,结合近期工作,通过
培养幼儿的抗挫折能力已成为一种迫切的社会需求,也是心理素质教育的一个重要课题。本文旨在探讨幼儿抗挫折能力的发展特点和影响因素,并尝试进行教育策略方面的探讨,为幼儿
2015年12月,我校法学院才让塔教授的专著《少数民族非物质文化遗产法律保护研究——以青海热贡为例》由中国政法大学出版社出版发行。该著作以热贡文化为个例,对少数民族非物
随着世情、国情的深刻变化,侨情亦随之变化。侨情新形势下,无论我国侨民,抑或是外国侨民,均对我国相关权益制度提出了新的要求。党的十八届四中全会明确全面推进依法治国战略
以某工程为背景,介绍了高层建筑外墙悬挑脚手架的搭设方案,包括脚手架计算、脚手架施工、脚手板的设置、安全网的防护设置等内容。其中脚手架计算有搭设方式与主要参数、荷载
思想品德课作为一门开放性较强的课程,需要采取多种方式拓宽教学内容,更新教学方法,培养创新思维,提高教学效率,引入实践环节,将理论和实际结合起来,使学生对学习产生强烈兴
分析了空间攻防对抗体系涵盖的内容,并对先进仿真技术、空间攻防对抗体系建模技术及其仿真技术进行了分析,并在此基础上建立了两个典型的空间攻防对抗仿真平台。研究过程中重
<正>英:核废料信息代代相传英国"放射性废料管理委员会"拟在地底约305米处建一个混凝土掩体,埋藏约4.69万立方米的核废料,整个工程的造价估计将高达70亿英镑。但令研究人员感
<正>日前,参与《中美合作——全球未来的关键》撰写的大西洋理事会高级研究员班宁·加勒特接受了专访,表达了美国专家对两国合作与世界未来的看法——记者:为什么说中美之间
<正>从重化工业为主到创新型国家,韩国的成功密码是什么?生产性服务业促进制造业结构升级研究是国际、国内产业经济研究的前沿课题。经调研发现,韩国生产性服务业与制造业结