MultCausal:一种利用多组学数据推断causal基因的统一方法

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:xxxhht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Causal基因的推断在理论和实践中都有重要意义,包括阐明生理过程尤其是人类疾病的机理,以及作物改良和疾病的治疗等,因此相应统计学方法的开发至关重要。现有的causal基因推断方法根据利用的数据类型和统计方法,大致可分三类:基于基因组的方法、基于其他组学数据和多组学数据的方法,以及基于网络的方法。方法繁杂多样,改进层出不穷,但仍然存在一些问题。一则这些方法无法同时形式化地容纳多种组学数据;二则这些方法并不孤立,但是这些方法间的联系并没有得到清楚阐释。鉴于此,本文开发了一个名为MultCausal的causal基因推断方法。主要思路是将多种组学数据以矩阵乘法的形式定义为设计矩阵Z,将Z矩阵带入线性模型运算求解,各基因P值取负对数,其相对大小即为causal基因的相对概率。为验证该方法的有效性,本文首先从现有三类方法中各选取一个代表(线性回归、GSMR、GeneRank),与MultCausal一起,在模拟数据和拟南芥开花时间数据集中加以比较。与三种方法相比,MultCausal效果有所提升,能够在控制假阳性率的同时保持较高的效力。随后本文探讨了MultCausal和三种方法的联系,形式上证明了MultCasual和线性模型、GSMR的等价性,并利用模拟证明了MultCausal和GeneRank的相关性。此外还从SVR的核技巧中得到的启发,将Z变成f(Z),显式地赋予设计矩阵非线性结构,从而提升了MultCausal的表现。
其他文献
目的探讨股骨近端重建技术在髋关节翻修术中应用的可行性,以及术中、术后并发症、近期临床疗效。方法回顾性分析2015年1月至2018年11月于我院行髋关节翻修术且术中使用股骨近
海洋海绵生物为人类世界提供了取之不尽的生物活性素材。根据2001年Faulkner的一篇报道,Faulkner和他的伙伴们2001年从来自菲律宾海域的Myriastra Clavosa海绵生物粗提取物中分离出了一组结构新颖的天然产物——Clavosolide A及其一系列家族化合物,它有着一个16元的大环,并且整个分子具有非常好的对称性,同时具有多个对称的手性中心。本论文设计了一种新颖的、简洁、高
伏社锰矿床位于我国重要的锰矿产出地域-桂西南地区,具有重要的锰矿成矿远景。作为新发现的锰矿床,前人对矿区内的锰矿床研究还有所欠缺,本文主要通过对锰矿床的地质特征、成矿环境特征、矿物学特征等方面的研究,结合锰矿床地球化学分析,对伏社锰矿床的成因提出一些认识。天等伏社锰矿床主要赋存于上泥盆统五指山组地层中,主要锰矿体分布于五指山组1段和3段的硅质岩、泥质硅质岩、泥岩和粉砂岩等含锰岩系建造内。锰矿层严格
随着高质量蛋白质和DNA实验结构(X射线,核磁共振,冷冻电镜)的增加,为我们在大数据场景下提高对生物大分子内部相互作用的理论认识开辟了空间。虽然以往的研究已经从基于统计学上的距离分布和相互作用能等方面对不同形式的氨基酸-氨基酸以及氨基酸-碱基接触(范德华、氢键)的相对丰度进行了分析,但是对于其内部的物理化学性质的研究则相对较少。在本工作中,我们在紧束缚近似方法的基础上,直接对蛋白质-蛋白质和蛋白质
目的:研究青海地区藏族与汉族H型高血压患者亚甲基四氢叶酸还原酶(Methylene Tetrahydrofolate Reductase,MTHFR)基因C677T基因型及等位基因频率分布是否具有民族差异性,以及
随着钢铁生产工艺的改进和社会经济发展的影响,企业对钢铁冶炼系统的可靠性要求越来越高,钢铁冶炼系统的可靠性研究也越来越受到人们的重视。本文针对冶金系统存在多态、多阶段的特点,对高炉炼铁系统的可靠性问题进行了深入研究,研究内容主要有以下两方面:(1)基于MDD的高炉炼铁多态系统可靠性分析针对高炉冶炼系统中组件存在多态性的特点,提出一种基于MDD的高炉炼铁系统可靠性建模方法。首先对高炉炼铁系统的组件建立
与传统的检测方法(如离子选择电极法、伏安法、比色传感器)相比,由于荧光传感器的操作简单、灵敏度高、选择性好、快速的响应时间而被广泛的应用在检测、识别环境中和细胞中的
随着中国移动业务种类以及用户量的急剧上升,如何科学的对用户进行划分以及分析消费行为习惯,并针对性地提供合适的业务产品显得尤为重要。基于此本文提出了一套基于粗糙集进
生物个体的新陈代谢离不开基因复杂的转录调控和遗传机制。随着高通量测序技术的快速发展,基因组序列的成功测序使得我们能够进一步探究隐含在序列背后负责的调控机制。人们发现真核细胞基因的表达调控受到多种因子的影响,如转录因子、增强子与DNA转录相关的酶协调合作,构成基因精准、高效的时空表达。近年来,三维基因组学的快速发展促进了全基因组范围内表观遗传修饰、调控元件的鉴定和其参与基因表达的转录调控作用研究。本
目的:非酒精性脂肪性肝病(Non-alcoholic fatty liver disease,NAFLD)是最常见的慢性肝病之一,与代谢异常尤其是糖尿病密切相关。本研究目的是探索合并糖代谢异常(Impaired g