基于Spark的肿瘤基因混合特征选择方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:Aegean1218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为处理随微阵列技术发展而急剧增长的肿瘤基因数据,实现对肿瘤基因数据的特征选择,结合集成特征选择和混合特征选择,提出一种Spark分布式计算框架的混合特征选择方法。利用F-score特征选择方法去除无关特征,进行初步特征选择,结合F-score、多分类支持向量机递归消除法、基于随机森林的特征选择3种方法得到最优的特征子集,并采用支持向量机对特征子集进行分类预测。实验结果表明,该方法能通过选择较少的基因达到较高的分类准确率。
其他文献
本文分析了股权结构与公司绩效间存在的相关关系,通过选取多个公司绩效评价指标,构建了一个能够对多个股权结构变量进行分析的回归模型。
乡镇(街道)工会作为地方级别的行政管理部门,其主要职责是:积极组织广大工会会员进行思想道德、行为规范、文化艺术、群众体育教育以及技能培训,组织开展惠民活动,有效维护人民群众
随着计算机技术和测试技术的突飞猛进,起重机的动力学分析得到了很大的发展,主要表现在如下几个方面:(1)数值分析方法取得巨大发展,许多过去根本无法计算的复杂的结构动力问题现在
一、农村水利面临的形势和问题农村水利是指在农村开展的水利建设、管理及其他有关水问题方面的工作,包括农村水工程、水资源和水环境。它涉及到闸、站、堤、河流、沟渠及水利
脑白质疏松(leukoaraiosis,LA)系由大多数因血管性因素导致的脑室周围/皮质下区(半卵圆中心)CT上的弥漫性低密度带或MRIT2加权像上的弥漫性高信号区。有研究表明,脑白质疏松可见于Bi
知识经济,通俗地说就是“以知识为基础的经济”,从内涵来看,知识经济是经济增长直接依赖于知识和信息的生产、传播和使用,它以高技术产业为第一产业支柱,以智力资源为首要依托,是可
目前认为导致老年人轻度认知功能障碍(MCI)的影响因素很多,血管性危险因素以及年龄、性别、教育水平等均与认知损伤有关。如何客观评价MCI的诊断、记忆和认知功能障碍的特征,是亟
目的检测子宫内膜癌中血管内皮生长因子(VEGF)-D及其受体VEGFR-3表达,探讨其在子宫内膜癌淋巴管新生中的价值。方法选择120例子宫内膜癌存档的蜡块作为观察组,60例正常增生期子