【摘 要】
:
目的探讨随机森林回归处理非线性、共线和具有交互作用数据的性能,并将随机森林回归应用于高维代谢组学数据的代谢网络构建。方法通过模拟试验验证随机森林回归在线性、交互
论文部分内容阅读
目的探讨随机森林回归处理非线性、共线和具有交互作用数据的性能,并将随机森林回归应用于高维代谢组学数据的代谢网络构建。方法通过模拟试验验证随机森林回归在线性、交互和非线性(多项式和指数)关系及不同的样本含量条件下回归分析性能,并同多元线性回归分析相比较。针对卵巢癌良恶性肿瘤鉴别的代谢组学数据,在随机森林判别分析确定的51个生物标志物的基础上,应用随机森林回归分析探索生物标志物之间的复杂的相互关系。结果模拟实验结果显示:若自变量与应变量间为线性关系,随机森林回归模型的效果与多元线性回归模型相近;对于具有交互作用及其他非线性关系的模拟数据,随机森林回归模型的效果明显优于多元线性回归模型。实际卵巢癌代谢组学数据分析显示:代谢组学数据具有共线性和交互作用等复杂的非线性关系,我们设定羟丙酮酸(V2409)作为靶向标志物,应用随机森林回归在其他50个代谢标志物中筛选出5个最具有潜在调控作用的代谢物质,进而根据这6个代谢标志物建立了贝叶斯调控网络,结果理想。结论随机森林回归作为一种非参数回归技术,在能够保证具有一定数量的样本含量(n>100)的情况下,对复杂数据具有优良的性质,能够在高维数据中有效地分析非线性和具有交互作用的数据,同时对共线性问题不敏感,可以有效地应用于高维代谢组学数据的代谢调控网络分析。
其他文献
遥感图像压缩的传统方法普遍存在着重构时间长、重构质量有待改进等应用难题。本文针对不同典型地物的遥感图像,采用K-SVD字典学习方法分别进行过完备字典训练。重构过程中,
随着半导体工艺的不断改进,利用已有的知识产权(Intellectual Property)核在片上系统(System on Chip)上进行大规模的集成电路设计的技术得到了迅速的提高。片上总线是实现各
现代市场经济的有序运行离不开政府,政府当好裁判的前提条件之一就是约束自己,只有受法制约束的政府才有可能成为有效的政府。市场秩序问题首先是政府自律问题。政府在市场经济
近年来,苏州市国土资源管理部门本着公开、公平、公正的工作理念,就行政复议中引入听证程序进行了探索和实践,制定了专门的行政复议听证程序规定。该规定涵盖听证适用范围、主体
白眉野草螟Agriphila aeneociliella(Eversmann)是我国小麦的新发害虫。其幼虫昼伏夜出,咬食小麦根茎基部及叶片,对早春小麦为害尤为严重。为探明白眉野草螟灾变的生物及生态学
随着高中课程改革的逐步深入,人们逐渐认识到化学史料在课程及教学中的重要性,并且意识到化学教科书是史料得以呈现的物质载体。对人教版高中化学教科书中史料的呈现角度、侧
<正>回顾性分析环磷酰胺治疗结缔组织病肺间质病变(CTD-ILD)的疗效和累积量间的关系,选取广东省人民医院2003—2010年门诊部及住院部诊断为CTD-ILD,同时接受环磷酰胺及糖皮质
人员流动,给新型冠状病毒肺炎疫情防控带来新的压力,无论交通运输还是市场消费都需要认真对待。战胜疫情,需要社会各方的共同努力。保护人民利益,保障百姓健康,引导人民科学防护、
李立三和毛泽东都主张武装斗争,李立三的武装斗争思想可以简要地概括为"城市中心主义"政治策略思想。对李立三"城市中心主义"政治策略思想的正确批判,是后来毛泽东得以提出"
死亡赔偿金制度一直受学术界和公众的广泛批评,死亡赔偿金标准的不统一是其遭受批判的主要原因。本文试从其性质入手,深入分析对死亡赔偿金制度批判的原因以及死亡赔偿金标准