基因表达数据的随机森林逐步判别分析方法

来源 :中国卫生统计 | 被引量 : 0次 | 上传用户:chenhuaxys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的给出一种新的随机森林算法,它能在建模过程中自动对变量进行筛选,建立“最优”判断模型。方法采用变量重要性评分和逐步迭代算法选择有作用的变量;通过实际基因表达数据考核其应用效果,并使用R语言编程做模拟试验验证其有效性。结果三种疾病基因表达数据的判别模型,在包含很少量的基因情况下便获得了理想的分类效果;模拟试验则显示在类间区分度较大的情况下,随机森林逐步判别分析的效果明显,能有效地将有作用的变量保留在模型中,提高模型的判别效果;在类间区分度不够大的情况下分类效果提高不明显。结论随机森林逐步判别分析可以有效地
其他文献
江南自然地理环境、山水审美意识的崛起、山水旅游的勃兴是晋宋山水诗兴起的主要原因。晋宋之际山水旅游审美特质表现为开拓性和探索性,并以此奠定了中国山水诗写实基础;山水
对金荞麦叶茶有效成分进行初步分离,并对每种成分建立了体外抗氧化模型追踪生物活性成分。用聚酰胺层析柱分离金荞麦叶茶水提取物,用不同浓度乙醇洗脱,得到5种初步分离提取物
以上海地区典型的冷热通道隔离封闭式数据机房为例,通过CFD模拟的方法研究小型机房冷通 道内气流组织情况,并借助服务器温度方程求出服务器出口温度,分析机房的热环境.最后在
圣约翰大学是中国第一家新闻系的诞生地。但对于该校新闻教育的情况,现有文献还难窥全豹。本文主要立足上海档案馆收藏的相关档案,还原了圣约翰新闻教育前后25年的发展历程。
目的分析芪苈强心胶囊联合左西孟旦治疗充血性心力衰竭的疗效及对血清脑钠素N端前体肽(NT-pro BNP)、同型半胱氨酸(Hcy)水平的影响。方法以2014年1月—2016年6月焦作市第五人
近代西方教会在华创办的各类学校曾一度被认为是对华进行思想、文化侵略的工具和手段,而对其进行了否定和批判。但是如果以更为客观和全面的视角审视近代中国高教发展史就不
党的“十八大”以来,建设社会主义文化强国成为国策。习近平总书记对于文化建设做了多次论述,提出了新的思想、新的论断、新的理念,特别是在文艺工作座谈会上的讲话,强调了文
大学文化是以大学为载体,通过历届师生的传承和创造,为大学所积累的物质成果和精神成果的总和。通过对大学文化的内涵、特点、功能及其建设原则的阐述,探讨了在新时期建设优
架空输电线路同塔多回架设可有效节约线路走廊,尤其适用于人口稠密、土地资源紧张、经济发达的地区。本文首先介绍了输电线路同塔多回架设的设计原则,并以同塔四回垂直排列的输
随着互联网的高速发展,网络教学平台在医药高等教育教学中发挥着重要的作用。该文基于学校提供的网络教学平台,对中药化学课程的教学改革及实践进行了研究,旨在进一步提高该