【摘 要】
:
随着人类基因组计划的实施和不断深入,产生了海量的生物数据,同时促使了DNA芯片技术的出现。肿瘤基因表达谱数据作为DNA芯片技术的一个产物,是人们研究肿瘤的良好数据来源。
论文部分内容阅读
随着人类基因组计划的实施和不断深入,产生了海量的生物数据,同时促使了DNA芯片技术的出现。肿瘤基因表达谱数据作为DNA芯片技术的一个产物,是人们研究肿瘤的良好数据来源。而肿瘤基因表达谱数据具有小样本、高维数、高噪声和高冗余的特点,容易导致“维数灾难”和“过拟合”现象的出现,这给数据处理带来了极大的挑战。从原始的特征集中选出最优特征子集的技术(即特征选择)是解决这一挑战的有效途径。但是常规的特征选择算法已远远不能满足需要,因此,更为高效的特征选择算法显得尤为重要。最大相关最小冗余(mRMR)算法的目的是在原始特征集合中找出与类别最相关,而特征间具有最小冗余的特征子集,它是常被用于处理肿瘤基因表达谱数据的特征选择算法之一。但是,当给定的特征集维数较大时,该算法计算起来比较耗时。针对这一缺陷,本文提出改进的mRMR算法,即mRMR-ChiMIC算法。该算法是将mRMR算法中度量相关性和冗余性的互信息(MI)用最大信息系数(MIC)来代替。目前特征选择算法的分类较多,每类算法也都有各自的优缺点。mRMR-ChiMIC算法作为典型的过滤型算法,同大多数过滤法一样往往不能自动确定最优特征子集的大小。为了更高效的选取最优特征子集,本文结合过滤法和封装法的优点,将mRMR-ChiMIC算法与Boruta算法相结合,提出了一种混合特征选择算法。该算法分为两个阶段:首先通过mRMR-ChiMIC算法找到候选特征集,快速过滤掉一些不相关特征和冗余特征;接着使用Boruta算法从候选特征集中选出最优特征子集。通过DLBCL、Prostate和Leukemia三个常用的肿瘤基因表达谱数据集进行实验验证,结果表明,本文提出的混合特征选择算法与mRMR和SRCMRMR算法相比具有更高的分类准确率,而且得到的最优特征子集的维数也更小。
其他文献
污闪事故对电力系统的安全可靠运行影响重大。伴随着我国电力建设的飞速发展,电网覆盖规模不断扩大,运行环境复杂多样,绝缘子表面所积污秽成分也随之存在差异。目前人工污秽试验方法中通常采用纯氯化钠对绝缘子积污成分中的可溶物部分进行等值模拟,导致多数人工污秽试验污闪电压偏低,人工污秽试验与自然污秽试验间存在不等价性。同时试验发现相同盐密下不同污秽成分绝缘子放电强弱不同,即等值盐密对污秽状态表征存在缺陷。因此
人脸识别是生物特征识别的一种,近些年来成为了计算机视觉、模式识别和生物测定学中最热门的研究课题之一。相对于其他生物特征来说,人脸识别具有自然性和非入侵的优势,随着
柔性电子技术是将电子电路集成在柔性、可延展基底上一种技术。柔性电子技术主要被应用于显示器、储能装置、太阳能薄膜以及可穿戴设备上。其中可穿戴设备在临床医疗等领域受
跨海桥梁下部承台-群桩复合结构在海洋环境中,承受着波浪和海流的共同作用,其受力状态非常复杂。因此研究承台-群桩结构在波流联合作用下的受力,对于实际工程有重要的指导作用。本论文以国家大力发展海洋经济,全面推动海洋科学为背景,依托国家自然科学基金项目《跨海大桥群桩-承台-桥墩整体结构波流力计算方法研究》,研究了不同几何形状的承台-群桩复合结构在波浪、海流和波流联合作用下的受力特性以及相互影响,对其理论
可充镁离子电池因为体积比容量高、成本低、安全性高等优点而受到广泛的关注。但是由于Mg2+溶剂化严重、电荷密度大,其在正极材料中扩散速率较慢。为了解决这一问题,可充镁离
当前国内钢铁工业面临着产能过剩的问题,提质增效的需求强烈,而表面缺陷检测作为保障产品质量的重要一环,仍旧依赖效率低、主观性强的人工检测方式。随着深度学习的不断发展,
人脸面部表情是身体语言的一部分,它在人际交往和社会生活中起着不可替代的作用。随着计算机硬件的快速发展以及人工智能时代的到来,如何使得计算机能够识别人脸表情再进一步
研究目的1.通过对胃部不适患者幽门螺杆菌感染率及患者心理健康状态、睡眠质量的现状调查;进一步了解耐药幽门螺杆菌患者的心理健康状态、睡眠质量的现状。2.将八段锦用于耐药幽门螺杆菌患者,探讨八段锦对改善其心理健康状态和睡眠质量的临床效果,为耐药幽门螺杆菌患者提供新的护理方法。研究方法本研究分为两个部分。1.对胃部不适患者现状调查和分析:采用13C尿素呼气试验、Kessler10量表、PSQI量表问卷调
小学语文教师进行教学研究是促进教师专业发展的重要方式,也是时代的需要,并且进行教学研究可以带来很多益处,比如可以提高小学语文教师的教学质量等。但在实际的教学研究中存在很多问题,小学语文教师要想做好教学研究,还需要对症下药。从前人的研究中,我们可以发现教师的教学研究存在很多问题,比如缺乏教学研究方法的相关知识、教学研究选题不恰当、教学研究能力比较薄弱、教学研究成果不多等诸多问题。因此,我们要通过较全
科学家在南极厚重的冰盖底下,发现一个巨大的冰下湖,其深度达到数千米,在冰下沉寂了数千万年之久,据科学家推测,冰下湖内部的水源极为纯净,且整个冰下湖还可能存在着新的微生