肿瘤基因表达谱的数据挖掘与识别分类

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:alucardlr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
肿瘤种类繁多,其致病机理复杂,是危及人类身体健康的主要恶性疾病之一,尽早确诊对患者的治疗至关重要。基因芯片技术是功能基因组学的一个突破,它所产生的基因表达谱数据极大的推进了功能基因组学的发展。基于基因表达谱的数据挖掘,可以让我们更好地认识肿瘤,从分子生物学角度去探索其发生机理,对肿瘤诊断、治疗以及新药物的研制都具有积极的意义。由于基因表达谱数据具有维度高、样本小、高冗余以及高噪声等特点,本课题采用时频分析工具从三个角度研究了肿瘤基因表达谱数据的特征提取。本课题提出了利用小波包变换对基因表达谱进行分解,进而提取相应各频带的样本熵值构成特征向量。然后本课题针对基因表达谱数据的高噪声特性,提出对肿瘤基因表达谱数据进行EMD分解,计算出相应各IMF与原始数据的相关系数,保留相关系数较大的IMF分量并重构数据,进而筛选获得特征向量。此外,利用基因表达谱数据在分数阶傅里叶变换最优阶次上的全局特性,筛选分数阶傅里叶系数幅值的熵权较大的位置的分数阶傅里叶系数作为特征向量。最后针对分别来自美国MIT大学和普林斯顿大学数据库的急性白血病、结肠癌等基因表达谱数据集进行了仿真验证,分类结果正确率都达到了90%以上。
其他文献
分析国内外重载运输的实践,阐述我国发展重载运输的必要性,并结合我国铁路货物运输需求特征,在充分考虑铁路科技进步对到发线有效长的影响以及对牵引质量的影响等关键技术因
在当今这样一个信息和传媒高度发达的时代里,"粉丝"已经发展成为一股不容忽视的社会力量,同时"粉丝"现象也上升为一种独特的社会文化现象。以"粉丝"群体作为研究对象,探讨了
随着李克强总理对互联网+概念的提出,国内迅速掀起一股互联网创业潮,传统行业与互联网相结合的商业模式成为现在创业的主流。而随着国家对大学生创业的大力扶持,大学校园内也
会计计量模式的选择(尤其以公允价值为主)是一个被长期讨论的问题,从公允价值的产生、发展,特别是在2008和2009年的金融危机期间,它更是成为了国际会计讨论的一个热点。本文
在利用微生物氧化合成维生素C(VC)的研究方面,阐述了微生物通过以D-山梨醇和D-葡萄糖为底物进行生物转化的代谢途径,以合成维生素C前体--2-酮基-L-古龙酸(2-KGA)的研究现状和
社会的不断进步推动了教学方式的多元化发展,微课就是由现代社会教育发展产生的。所谓微课就是指运用先进的计算机技术和网络技术,对传统的教学模式进行改革,以提高教学质量
预算管理制度在我国企业应用已逾30年,虽然许多企业借此取得了卓越的成效,但信息不对称始终是管理界所诟病的问题之一。预算责任人凭借信息优势做出的一些私下卸责行为,如偷
苹果多酚作为一种新型的天然抗氧化剂,是苹果中一类重要的活性物质,在未成熟的苹果和果渣中含量丰富。介绍了苹果多酚的组成及性质、生化及生理功能、制备方法及分析,在医药
背景:胃癌是全球危害人类健康的的常见恶性肿瘤之一,每年有大量的新发和死亡病例,其中男性新发病例是女性的将近3倍。在中国,胃癌的发病率位居常见肿瘤第二位,死亡率位居第三
研究背景结肠癌是我国最常见的消化道恶性肿瘤之一,发病率和病死率呈逐年上升趋势,全世界每年大约有60万人死于结肠癌。结肠癌的发病是由外部环境因素和机体内部因素共同作用