【摘 要】
:
单一机器学习算法已广泛应用于癌症预后的预测中,但由于功能相似的基因之间存在冗余信息,使得这些方法在进行特征筛选时容易忽略一些与疾病相关的基因。为了能得到相对更稳定
【机 构】
:
四川大学化学学院; 农业部沼气科学研究所;
【基金项目】
:
国家自然科学基金(NO.21575094,NO.21675114)对该工作的支持
论文部分内容阅读
单一机器学习算法已广泛应用于癌症预后的预测中,但由于功能相似的基因之间存在冗余信息,使得这些方法在进行特征筛选时容易忽略一些与疾病相关的基因。为了能得到相对更稳定模型及更全面的癌症相关基因集,我们尝试了集成机器学习算法。该方法不仅可将多个机器学习方法集成在一起,通过投票的方式对最终结果进行预测,还可整合多个检测平台的数据,如mRNA测序平台、miRNA测序平台等,利用不同平台从不同角度对同一样本的"表征",实现对样本更为准确的分类。研究中,针对4类肿瘤数据,我们分别采用5种变量选择方法来分别对mRNA和miRNA两种测序平台进行变量的筛选以及利用7类建模方法,总计建立了980个单一预测模型,分别对各数据集中的病人预后指标进行预测。此外,同时对比利用投票的方式将7类建模方法进行集成后的预测结果。研究结果表明,对于癌症预后的预测,我们提出来的集成学习算法比单一的机器学习算法更可靠,并且我们的算法可以提供更全面、更完整的筛选出癌症相关的基因,从而可以更好地促进癌症机制的探索和潜在的药物靶标的识别。由于该工作仅在探索集成机器学习算法的优势,因此在预测时,并没有加入任何关于癌症基因的先验知识,如在实际应用中,根据先验知识对癌症基因进行预筛选,应能获得更准确的预测结果。
其他文献
本课题旨在利用半连续铸造方法制备出高质量的过共晶Al-Si合金-A390合金管坯,经过热挤压和热处理后制成可替代传统铁质缸套的汽车用发动机缸套。主要研究铸造工艺对半连续铸
构建和谐社会离不开文化建设,高职院校的和谐发展也同样离不开校园文化建设。深刻认识校园文化建设的意义,客观洞察校园文化领域的消极因素的影响,准确把握加强校园文化建设的途
文章利用支持向量机进行财务危机模型类别化设定及样本类别化训练,获得基于SVM的财务危机在风险程度差异化基础上的检验样本,由对应的检验样本形成分类别预警。研究基于风险
近年来,由于城镇化建设带来的降水径流过程变化及城市排涝能力不足等原因,郑州市城区一旦遇特大暴雨便内涝频发,而地下轨道交通因其位于地表以下,在抗洪防汛上存在难以克服的先天劣势,一旦发生内涝将会给人们的生命带来威胁,还会造成巨大的经济损失。鉴于此,本文通过综合考虑郑州市轨道交通地下出入口的属性数据、气象条件、地形地质、排水能力、社会经济等多重影响因素,构建了郑州市地下轨道交通暴雨内涝沿线建筑物脆弱性评
手术室是医院的重点科室,其工作特点:业务面广,技术性强,洁净要求高.目前,多数手术室的现状是手术难度高,量大,人员短缺,因此,做好手术室新护士的培训,使其能尽快具备单独操作
戒毒方式主要有自愿戒毒、强制戒毒和劳教戒毒三种 ,这些方式主要是通过医疗行为治疗吸毒者以消除其对毒品的生理需求直至最终戒掉毒瘾。而实际上戒毒后的复吸率仍很高 ,这就
20世纪人类的又一奇迹:1997年5月,内蒙古包头市向世人宣告,已经实现了“社会面基本无吸毒人员”,再用 3年时间,巩固已有的禁毒成果, 2000年实现全市无毒害。包头市禁毒经历了三个阶段:1989-1992年摸索治理
本文以某MPV车型为例,论述了被动降噪技术在实车上的应用。文章首先介绍了汽车车内噪声的来源、噪声频谱特性、噪声源贡献度及传播路径,其次针对以上问题提出降噪措施。最
10月29日,飓风“桑迪”给纽约带来强风暴雨,7条地铁线路以及多个公交总站被淹,这是纽约地铁108年历史上所遭遇的最严重灾难。“桑迪”过后,即使积水排净,地铁能否立即恢复运营仍是
培养自主学习能力是大学外语学习的最终目标之一。自主学习不等于自学,教师的中介作用不容忽视。文胡晓静章针对教师如何引导大学生积极参与自主学习过程,提高自主学习的效率