基于互信息的信息基因选择算法研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:idlerman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互信息是信息论中的重要概念,被用来度量两个随机变量之间的相关性。在信息基因选择中,以互信息理论为基础的最大信息系数(MIC)与最大相关最小冗余(mRMR)是特征选择中最具代表性的两种方法。针对肿瘤基因表达谱数据的小样本、高维数、高噪音特点,选择一种合适的算法来进行信息基因的选择尤为重要,MIC虽具有普适性与等价性的优点,但其在信息基因选择中仅能对特征与类别进行相关性度量,不能有效去除特征间的冗余特征;mRMR虽能有效去除冗余特征,但对数据规模有一定的局限性。因此,本文提出改进mRMR的新算法-—mRMR-ChiMIC算法,将原mRMR算法中度量相关性的互信息使用归一化后的互信息(MIC)来代替,并使用ChiMIC算法来近似估计MIC值。通过DLBCL、Prostate、Lung三个公用数据集进行实验验证,结果表明,本文提出的mRMR-ChiMIC算法较原mRMR算法提取的特征具有更高的分类准确率,且有效降低了计算复杂度。
其他文献
元认知是语文阅读中重要的认知加工过程。语文阅读是语文教学任务的重中之重,越来越多的老师开始重视学生阅读能力的培养,从“学会知识”到“学会学习”。大量心理学研究表明,元认知干预能有效提高学生的阅读水平和阅读成绩。小学生在中低年级已完成了大部分识字任务,高年级开始学会阅读文章,领悟其思想感情,这正处于语文阅读元认知高速发展时期,此时进行元认知干预对其语文阅读能力发展具有重要的意义。本研究旨在探究小学中
“九一八”事变爆发后,在日本军部的号召下,多数文人表现出积极配合的姿态,为日本军国主义的侵略行为进行辩解和美化。但此时还有一部分有良知的日本文人没有屈服于日本反动政府
针对单平台观测条件下目标运动特性反演问题,提出了基于序列图像的目标空间位置重建及运动参数估计模型和方法。为抑制大气折射对位置重建精度的影响,提出将大气视为球面分层
结合长期外业实践,阐述了施工及天气角度、仪器及棱镜工作状态、施工组织等因素对CPⅢ平面工作的影响,提出了如何避免或消减这些因素对外业工作的影响,进而更快、更高精度地
目的研究分析小儿高热惊厥的病因、临床特点以及护理对策。方法选取2014年7月至2016年3月间我院收治的87例高热惊厥患儿,将其随机分为观察组43例,对照组44例,对照组患儿采取
脑卒中后抑郁(PSD)是脑血管疾病的常见并发症之一,它不仅导致了躯体症状的加重,而且加重了患者的精神痛苦,使生存质量下降,甚至可以使死亡率增加。笔者采用丹栀逍遥散联合氢溴酸西
采用新型序批式气升内循环生物膜反应器(BSBAR)对混合营养型小球藻进行挂膜培养以去除黑臭水体中的氮、磷污染物。经过7 d的培养,BSBAR中附着生物量比悬浮序批式气升内循环藻类
WXJ型的微电子相敏轨道电路接收器,以单片机为核心,采用先进的数字处理技术,对轨道电路中的信息进行采集、分析和处理,完成相敏轨道电路接收功能,可以替代原来的相敏轨道继电
关于片面共犯是否应以共同犯罪论处,理论界有肯定说与否定说之争.因果共犯论只是为共犯提供了处罚根据,并未实际解决片面共犯是否成立共犯的问题.肯定说和否定说的理论基础是
本文认为”苏报案”的结束时间并非章太炎和邹容最终定罪的1904年5月21日,而应以章太炎的出狱日期为判准。但章太炎的出狱日期并非百余年来海内外学界所认为的1906年6月29日,而