【摘 要】
:
生命科学正在经历大数据的时代,数据库的大小正以指数形式增加.目前,数据库包含了上百万的转录组学数据和数以千计的蛋白质组学数据.差异表达分析,即比较不同条件下的基因表
论文部分内容阅读
生命科学正在经历大数据的时代,数据库的大小正以指数形式增加.目前,数据库包含了上百万的转录组学数据和数以千计的蛋白质组学数据.差异表达分析,即比较不同条件下的基因表达水平,现已成为寻找生物标记,目标靶向和候选基因的主要工具.传统的基因表达数据分析是以单个基因为单位,这忽略了基因间复杂的相关性和协同机制.忽视潜在的生物学信息不仅使分析的功效降低,而且不易发现隐藏的重要生物学信号.因此,基因集分析方法更加适用于高维的基因数据.在本篇论文中,我们研究的是两组与疾病相关的差异通路检测方法:传统的Hotelling’s T2检验、对角线Hotelling’s T2检验和修正的Hotelling’s T2检验.传统的Hotelling’s T2统计量要求样本数大于变量数.然而,对于基因集分析,样本数普遍小于基因个数.结果导致Hotelling’s T2统计量的值不唯一.对角线的Hotelling’sT2统计量忽视协方差阵S的非对角线元素虽然能够解决协方差阵的奇异问题,但这种方法忽略了基因集内部基因的相关性.在这篇论文里,我提出了一种修正的Hotelling’s T2统计量,记为RT2统计量.它弥补了上述两种方法的不足.在模拟实验中,以ROC曲线作为评价标准,比较本文改进的方法与Hotelling’s T2检验法和对角线Hotelling’s T2检验法在检验差异通路能力方面的优劣.通过模拟实验证实本文的方法对差异通路的识别能力更强.
其他文献
恒化器是一个用于连续培养微生物的实验装置,也是一种非常重要的生物数学模型.本文建立并研究了两类带有时滞的恒化器微生物培养微分方程模型.而Lyapunov函数法在研究动力系统
本文引入了t-Rickart模和t-dual Rickart模的概念,并讨论了它们的性质.证明了:1.t-Rickart模(t-dual Rickart模)保持直和项;2.一个模M是t-Rickart模当且仅当M=Z2(M)⊕M,且M是(non
The viscous flow in a wavy channel with convective boundary conditions is investigated. The channel is filled with a porous viscous fluid. Two cases of equal an
本学位论文讨论一类特殊的约束优化问题,即互补约束优化问题(简记为MPCC).MPCC在经济、交通运输、网络设计、工程设计等领域有着重要的应用.因此,研究MPCC问题在理论和应用方
检验两分布总体是否相等在实际中有非常广泛的应用。例如,新旧药物、新旧方法的分布多数可以用正态分布来拟合,而且由于当今数据的急剧增加,数据的类型也更加多元化,使双参数指数
量子代理签名是量子数字签名领域最重要的研究课题之一,其在身份认证和保护数据完整性等方面扮演着至关重要的角色. 近几年来,一些基于可控量子隐形传态的代理签名方案被Cao
为提高大豆的耐旱耐盐碱性,将拟南芥转录因子DREB2A序列优化后,构建了植物表达载体pCAMBIA3300-DREB2A,利用农杆菌介导法将DREB2A基因导入大豆品种Willimas 82和Bert中,转化
Banach空间的几何理论的研究领域所涉及的研究内容多、范围广、覆盖面全,其空间的几何结构以及几何常数也是研究者们关注的内容,近年来,越来越多的研究者们总是可以在几何结构的
力学系统的运动与所受作用力及所加的约束有关。所以,可以通过力来控制运动,也可以通过约束来控制运动。随着现代工程力学的发展,控制理论得到广泛应用,可控力学系统的研究越发具有重要的现实意义。本文基于时间尺度理论,建立了相空间中可控力学系统和二阶线性可控力学系统的Noether理论,并进一步建立了时间尺度上弱非完整系统的Noether理论。1.引进时间尺度上广义动量和Hamilton函数,基于时间尺度上
时标动力学方程是方程中的一个新的研究领域,既包含微分方程和差分方程作为特例,也可以描述连续和离散混合的过程,在物理、生物、控制、工程中具有潜在的应用前景.指数型二分性