图能量在肿瘤特征基因提取问题中的应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:wuyishijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片可以快速检测成千上万条基因,从而对生物细胞基因水平做出一个全面的认识。近年来,越来越多学者将基因芯片技术应用到肿瘤与癌症的研究中。针对维数高、样本数量少的微阵列数据,如何从海量数据中提取出数量很少的与疾病和肿瘤分类相关的特征基因,对于推进肿瘤的基础研究和发现肿瘤致病机理,科学的认识肿瘤疾病本质具有重要意义。本文致力于通过选取数量较少的特征基因获得正确率较高的分类效果,主要研究工作如下:  一个共轭烃分子的能量(π-电子在分子中运动产生的能量)与分子的几何结构图的特征值有很重要的关系。由此而构造的图能量(Graph Energy)是一个描述分子性质的重要变量。文章提出了基于图能量的基因选取方法,将图能量引入到基因芯片分析中,将图能量与信噪比函数(SNR)结合起来,构造一个新的挑选基因的函数SNRGE。提取特征基因时,本文首先使用k-均值聚类对所有基因进行聚类,通过将特征相似的基因聚为一类从而删除冗余基因。然后采用SNRGE公式对所有的基因进行排序,分别在每一类中选取一个得分最高的特征基因。通过该方法在维数高、样本少的基因表达图谱中选取与癌症具有重要相关性的基因,随后使用支持向量机对提取的特征基因进行分类验证并获得正确率。文章通过在结肠癌数据库上的实验验证图能量在特征基因提取中可以获得很好的效果。  为了验证文章提出方法的性能,本文给出了一个全面科学的验证。验证包括:与传统的信噪比函数方法进行交叉对比;使用其他文献中提出的信噪比函数替代本文提出的基因选取方法中的SNRGE公式;使用不同的分类器对不同基因提取方法进行对比;针对选取的特征基因进行生物相关性分析;在四个常用的基因芯片数据库上对比不同的基因提取方法的分类效果。将以上五个实验获得的结果进行对比研究,结果证明本文提出的特征基因提取方法在癌症分类问题中是有效的。
其他文献
正系统是一类几乎在所有领域中都常见的系统,比如工程学,生态学,网络通讯等.这类系统具有一个公共的特征,即当初始状态和输入为非负值时,系统的状态和输出也总是非负值.另外,实际的
编者按:中华人民共和国住房和城乡建设部于2010年1月6日发布了“关于开展注册公用设备工程师、注册电气工程师、注册化工工程师注册工作的通知”,为了及早将有关的信息通过这
从调绳离合器的作用和工作基本要求入手,分析了常见离合器的结构和性能特点。以2JTP1.6×0.9型绞车为例,结合绞车的实际工作状况和结构,设计了一种新型调绳离合器。该离合器
1997年,“依法治国”写进党的十五大报告,成为“党领导人民治理国家的基本方略”.依法治国,建设社会主义法治国家,不仅是全党的使命,也成为全民、全社会的责任与义务.法治,以
一切为了群众、一切依靠群众,从群众中来、到群众中去的群众路线,是我们的事业不断取得胜利的重要法宝,也是我们党始终保持生机与活力的重要源泉。坚持党的这一根本工作路线,
本文主要是对次线性期望框架下的G-正态分布及G-布朗运动进行数值模拟并对所用方法进行数值误差分析。  在金融中的风险度量以及波动率不确定性的研究中,次线性期望的概念是
库存控制自从被提出以来就受到了广大学者的关注。确定性库存下经典的EOQ模型已经不再适用于复杂多变的当今生产消费市场。社会生产力的高速发展、居民的购买力不断上涨带动
摘 要:通过对庄36井区长8储层的岩石学特征、物性特征和孔喉特征等进行了深入分析,表明:庄36井区长8储层属低孔—特低孔、特低渗—超低渗储层,岩性主要为细粒岩屑长石砂岩,发育粒间孔和溶蚀孔,孔喉结构类型属小孔隙、微细喉道型,其储层物性主要受沉积作用和成岩作用的共同影响,造成水下分流河道和河口砂坝物性明显好于河道侧翼。  关键词:鄂尔多斯盆地 庄36井区 储层  一、沉积背景  鄂尔多斯盆地是一个整
数学物理逆问题是现代数学中的一个热点研究领域,研究它的难点在于它的不适定性.在本文中,我们考虑一类经典的逆问题,即热传导问题的侧边值问题(SHE),具体的我们考虑:{uxx=ut,x≥0
全息数据存储系统很久已有大存储容量、短存取时间和高数据传输率的希望。诸如铌酸锂(LiNbO3)之类光折变材料可在适中激光功率下用于全息图记录(图1)。图1 数字全息记录光装