基因表达谱数据特征选择方法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liuyong19840815
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着分子生物领域的发展,基因芯片技术得到快速提高,基因表达谱数据的获取已经变得越来越方便、可靠。但样本数量小、维数高、基因间关系复杂、信噪比低等特性给基因表达谱数据分析带来了很多新的困难。本文以特征基因选择问题为研究内容,基于现有的特征选择方法,开展了如下工作:   1.分析了现有特征基因选择方法的优缺点。Filter方法简单快速但分类精度不高;Wrapper方法和Embedded方法分类精度高但算法复杂度过大。因此,目前越来越多的研究注重这三类方法的综合,提出了Filter-Wrapper方法和Filter-Embedded方法。本文采用此思想,提出两种基于Filter、Wrapper和Embedded方法综合的特征基因选择方法,充分发挥了上述三类特征选择方法的优点,达到较好的分类效果。   2.分析比较基于递归特征消除的RF-RFE算法和SVM-RFE算法。现有的研究大多采用支持向量机、神经网络等作为分类器。随机森林具有优越的分类性能,逐渐被广泛使用。本文对随机森林进行研究,通过RF-RFE算法和SVM-RFE算法的比较,验证了随机森林对基因数据分析的有效性。   3.提出QPSO-RF特征基因选择方法。采用启发式搜索算法和分类器进行封装是当前研究的一个方向。本文定义了一个带有调节分类准确率和特征子集大小的平衡系数的适应度函数,采用量子粒子群算法作为启发式搜索算法,与随机森林分类器进行封装进行特征基因选择,该方法可在选出较小特征子集的同时取得较好的分类效果。   4.提出基于Proximity矩阵差异性的特征基因选择方法。已有的随机森林算法对OOB数据的分类准确率变化有时并不敏感,无法准确地反映特征的重要性。本文在分析了随机森林的Proximity矩阵对模型参数的鲁棒性和对特征变化的敏感性的基础上,利用Proximity矩阵差异性进行特征选择。实验结果表明,其性能优于已有的基于OOB数据分类准确率估计的特征选择方法。  
其他文献
无线定位技术综合了无线通信、网络技术、嵌入式系统及传感器技术等,是继互联网之后将对人类生活产生重大影响的热点技术。无线定位系统能够实时采集和处理不同目标的位置信
柴油发动机是各种大功率工程运输工具的主要动力源,高压共轨式发动机将喷射压力与喷射过程解耦控制,是内燃机领域研究与开发的热点。柴油机存在着普遍的能耗大,污染严重等问题,当
Magnus旋转式减摇装置是一种新型的船舶减摇装置,在低航速甚至零航速下具有很好的减摇效果。另外,Magnus旋转式减摇装置还具有体积小,重量轻,结构简单,安装方便,驱动功率小等
随着世界经济的发展,能源问题日益严峻,能源需求及能源相关二氧化碳的排放已经成为国内外学术界和各国政府共同关注的热点话题。中国作为世界上最大的发展中国家、第二大能源
随着电力电子器件在电力系统中投入使用,电网中产生了大量的谐波,严重影响着电力系统的安全运行。所以要最大限度地对谐波进行抑制与消除,解决此问题的关键在于能准确的检测出各
结合了多种先进技术的智能交通系统(ITS)在解决当前存在的诸多交通问题中显现出越来越重要的作用,交通信息采集作为基础环节在整个ITS中有着重要的作用。视频检测相比于传统信息
目前能源危机日趋明显,世界各国对节能减排提出了更高的要求,在此背景下低污染、低油耗和高功率成为柴油发动机的主要发展趋势。高压共轨电控喷射柴油发动机在降低排放、提高效
发射机作为广播电视节目信号发射的主要设备,其长期、稳定、可靠地工作对广电系统具有十介重要的意义。随着科学技术的飞速发展,发射机控制系统已成为发射机的核心部分,对实现发
图像局部特征的提取与匹配是图形图像和计算机视觉领域的一个十分重要的问题,具有仿射、光照、部分遮挡不变性的特征提取和匹配是图像局部特征的提取与匹配问题的核心内容。尺
音频信号的处理和研究对当今生活具有重要意义。本文主要针对连续音频流的若干特征和相关结构化参数进行了分析,详细介绍了应用聚类和模糊聚类分析进行分类器的设计方法,优化