基于维数约简的肿瘤基因表达谱数据研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:mario2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基因测序技术的提出及计算机技术的飞速发展为精准分析肿瘤基因表达谱提供了希望,其已经成为精确医疗的重要研究对象。如何更准确的对高维的基因数据进行维数约简并且保持数据的全局与局部结构尽可能不变已经成为数据挖掘及机器学习的热门研究方向。本文结合低秩理论对基因数据表达谱的缺失点填充、特征提取及特征选择问题展开研究。本文主要的成果主要有以下几点:  1、本文首先针对当前的肿瘤基因数据的缺失点填充、特征提取和特征选择方法做基本介绍。在缺失点填充方面,描述了K近邻及局部最小二乘法矩阵填充方法;在特征提取方面,阐述了主成分分析、独立成分分析及局部线性嵌入算法;在特征选择方面,介绍了四种广泛使用的评分方法:Fisher评分、方差评分、拉普拉斯评分及稀疏评分特征提取方法。将各个算法与基因数据紧密结合进行详细介绍。  2、为解决肿瘤基因表达谱数据后续研究需要完整数据矩阵的问题,针对包含缺失点的数据集,本文提出基于矩阵填充与模糊C均值相结合的缺失点估计方法(FCM_MC)。该方法充分利用肿瘤基因表达谱数据的冗余信息,通过模糊C均值聚类得到具有良好的低秩特性的基因语义片段,再利用矩阵填充方法分别对每个语义片段进行缺失点的重建。在不同数据集上进行实验,与传统缺失点估计算法比较。实验表明 FCM_MC算法在缺失数据估计准确度和类结构保持度上效果得到有效提升,同时运行效率较高。  3、针对肿瘤基因表达谱的特点,提出了基于低秩图正则非负矩阵分解(LGNMF)的特征提取方法,解决了 NMF算法中缺少数据的全局信息问题,提升特征提取的有效性。该算法在 NMF算法的基础上引入低秩图约束,提高了对数据局部和全局结构的描述,使得经过特征提取后的特征空间具有更强的分类能力。通过 LGNMF算法对肿瘤基因表达谱数据集进行降维,获得低维特征空间,再使用 KNN分类器对低维特征空间进行分类。通过与 NMF、GNMF和 RGNMF算法在四组标准肿瘤基因表达谱数据集进行对比,实验结果表明LGNMF算法能够有效提升分类效果。  4、为了完成肿瘤基因的特征选择,采用基于低秩评分的肿瘤基因表达谱特征选择算法,该算法通过构建基于低秩表示的相似度矩阵来揭示数据的全局结构特性和鉴别信息,从中选择分类能力强的特征子空间,达到大幅度降低原始数据空间维数的目的。经实验验证,与LS、SS的评分相比取得了更好的降维效果有利于后期分类结果。
其他文献
实现了一种基于形状知识的长球销类不合格品自动检测系统的视觉方案。该方案首先利用长球销的形状特点得到球头圆心位置,根据工件的物理参数定位待识别部位的图像坐标,从而有
主汽温度是电厂中汽、水工质温度最高的一点,因此对主汽温进行合理有效的控制,是目前研究的热点。电厂主汽温对性具有大迟延、大惯性、非线性和时变性等特性,常规PID控制方法
近年来,随着网络的普及,网络变压器的需求量不断的扩大,由于其体积太小,不得不使用人工生产。而在生产线上通过人工来对磁环进行检验效率较低,而且会产生无法完全消除的漏检
迟滞具有多值映射、记忆性、和非光滑性特征。迟滞非线性系统中固有的迟滞特性,会使系统产生振荡,降低系统的控制精度,甚至会导致系统不稳定。所以,研究迟滞非线性系统的建模
汽车电子嵌入式操作系统是汽车电子控制系统中的关键核心技术之一,随着OSEK/VDX标准的逐步推广应用,国内外很多厂商正从事OSEK/VDX嵌入式操作系统的研发工作。为检验各个不同厂
汽轮发电机组是电力生产的重要设备,由于其设备结构的复杂性和运行环境的特殊性,汽轮发电机组的故障率不低,而且故障危害性也很大。因此,汽轮发电机组的故障诊断一直是故障诊
21世纪,我国对电力工业结构进行了调整,新建的火力发电机组已进入到超(超)临界参数、1000MW、大型机组阶段。目前,超超临界机组已经广泛应用于许多国家,在国际上已经逐渐成为一种成熟、可靠的发电技术。给水控制系统是火力发电机组控制系统中较为重要的子系统,尤其在超超临界机组中其控制更为复杂困难。论文重点研究了1000MW超超临界机组给水全程控制问题。超超临界机组采用的是直流锅炉,与自然循环锅炉相比,
工业无线技术作为信息领域的一个全新的方向,其在降低自动化成本、提高能源利用效率和产品质量等方面发挥着重要的作用。WIA-PA标准是我国自主研发的一种工业无线标准,而其数据
综合评价是系统工程领域研究的重要分支,其方法的研究是一个多学科边缘交叉、相互渗透、多点支撑的新兴研究领域。它是决策科学化、民主化的基础,是实际工作迫切需要解决的问
电控自动离合器简称ACS(Automatic Clutch System)是在传统干式摩擦离合器和手动变速箱基础上安装电控系统,取消离合踏板的手动控制,实现自动离合。由于保留了传统的离合器踏