用Regularized Group Lasso Regression(RGLR)方法寻找差异表达基因pathway

来源 :北京大学 | 被引量 : 0次 | 上传用户:myevanlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息中,一个很重要的研究领域是如何从大量microarray实验的数据中挖掘出有生物学意义的知识,而其中如何寻找在两类或两类以上样本中表达差异的基因集合(或基因pathway)正成为研究热点。已有寻找基因pathway的方法大体可以分为两类。一类是基于统计中假设检验的方法,如被广泛讨论的GSEA,还有PAGE,基于GSEA的双假设检验以及GSA方法等。这些方法虽然在一定程度上克服了传统的单个基因分析法的缺陷,却仍然存在着这样的缺点:没有把基因之间以及基因集合之间的关系考虑进去,也没有对挑选出的基因pmhway作基因选择,而这些能提供很丰富的生物学信息。另外一类方法是基于变量选择的分类模型,如Ma等提出的Supervised Group Lasso方法,作者称该方法能同时挑选基因和基因集合,实际上该方法只是进行了两步的基因选择,并没有把基因集合之间的分类能力考虑进去;而且参数估计算法十分复杂。本文结合Lasso的思想,提出了Regularized Group LasSO Regression(RGLR)模型,通过合理设置参数,我们在选择基因pathway的同时,对pathway内的基因也进行变量选择,有效地克服了已有方法的缺点,使得对结果的解释性大为增强;我们也提出了求解模型参数的有效迭代算法,并在模拟数据和实际数据中得到了很好的结果。本模型良好的扩展性也为更为深入的研究提供了方便。
其他文献
本文从2016理科数学18题出发,依次从试题解答、教学反思入手给出几点教学建议.
对于无约束优化来说,有很多基于导数之上的方法,例如:最速下降方法,拟牛顿方法等等。其中,拟牛顿法还具有局部超线性收敛性,是很有效的算法.但是,在实际生活中,存在一些来自于物理、化
1952年,美国经济学家、诺贝尔奖获得者Markowitz发表的著名论文“资产组合选择”,标志着现代资产组合理论的诞生,该文首次提出用投资组合的均值收益率与方差(或标准差)来分别表
动力学就是研究动力系统中状态变量如何随时间变化的学科。动力学系统方程是在动力学规律的研究中,定量表述状态参量随时间变化的数学方程。本文从不同角度对动力学方程进行了
深圳市龙岗区,风景秀丽,人杰地灵,被称为深圳的“后花园”。该区于1993年设立,总面积约940平方公里,入口100多万。龙岗区国家税务局前身为深圳市国家税务局龙岗分局,于1994
在语文教学中,必须紧紧围绕一个中心,时刻夯实两个基本点,扎实稳妥地采取三项措施.这样“一二三,齐步走”,才能引导学生在艺术美的天地里任意驰骋,不断完善人的综合素质.rn一
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在数理统计中,影响分析理论作为判断模型扰动对统计推断结果的有效理论工具,已在许多线性模型中有着重要的作用.但现有的理论中对时间序列单位根检验却没有太多的关注.因此本文对
本文对极值图论中的两个问题作了研究,所获得的几个主要结果如下。 (1) 设br(K)是最小的整数n,使得对K用k种颜色进行任意着色都会包含一个单色的K。令z(n;t) 表示K 的子图在
本文由三章组成。在第一章,我们介绍了研究工作的目的及其背景。在后两章,我们分别讨论了两个不同的问题,并给出了相应的结果。在第二章中,我们考虑下面的半线性热方程: 一方面