基因变异间的因果关系发现方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:nishi1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高通量测序技术的成熟和普及使得基因测序数据海量产生,如何从这些数据中挖掘出充分的信息是生物信息学的热点和难点。生物信息学中,基因变异间的相互作用一直是全基因组关联分析的难点,其相关研究成果也必将会对人类社会带来冲击。对基因变异间的因果关系进行研究是合理应用相关科研成果和做好相关问题防范所不可或缺的一环。关于基因变异间的相互作用的研究,目前多数是在相关关系的层面进行的,容易引入假阳性。本文则从因果关系的角度切入,基于WTCCC(Wellcome Trust Case Control Consortium)的数据,分别从基因粒度和SNP(Single Nucleotide Polymorphism,简记为SNP)粒度的数据设计因果关系发现算法,提出了基因变异间的因果关系发现算法和非对称因果关联规则发现算法,展开了基因变异间的因果关系发现问题的研究。通过构建因果网络来描述基因变异间的因果关系,检测出两种粒度的数据中所隐含的有向结构关系,该方法发现了数据之间的有向结构,其不对称性揭示了基因变异间的因果关系。在基因变异间的因果关系发现算法中,根据一个基因包含了多个SNPs位点的实际情况,对WTCCC研究机构的SNPs数据进行编码处理,把同属一个基因的多个SNPs数据编码为离散型的基因粒度数据。在进行因果关系发现时,选出一个目标基因,遍历其他的基因,经过条件独立性检验遴选出跟目标基因直接相互作用的备选基因,并通过算法的后向阶段把冗余的非直接互作用基因剔除,以减少因第一类错误而引入的基因,提高了因果关系检测结果的可靠性,最后根据汇连结构在条件独立性上的特性识别出了备选基因和目标基因之间的结构,进而推出其因果关系。实验结果检测出了一批因果性较强的基因变异,可以给相关的生化研究提供参考。针对SNP粒度数据提出了非对称因果关联规则发现算法,把关联规则挖掘和VStructure结合起来,检测数据中的因果结构。首先基于信息论提出了V-Structure Measure(VSM)以度量变量间的结构关系和基本的汇连结构的匹配程度,并把该指标推广到了更一般的多对多情形中,然后针对对称性情况给出了非对称因果关联规则发现算法(ASymmetric Causal Association Rule Discovery,简记为ASCARD)的具体流程,并在模拟数据上分别使用ASCARD方法和现有方法进行检测,证明了ASCARD方法的有效性。最后在WTCCC的真实SNPs数据集上使用ASCARD方法检测。实验结果检测出了不同基因上的SNPs之间的因果性。结合相关研究,文章也对部分实验结果从生物学的角度进行了可能的解释和一个可供参考的研究提议。
其他文献
MCMC方法是一种求解高维非线性问题的有效手段,高能闪光图像重建问题就是一个典型的高维非线性反演问题。然而目前的大多数重建方法都是基于一个线性的近似模型,利用光程图像进行重建。由于闪光图像受到系统模糊的影响,基于该线性模型的重建结果较模糊,特别是在边缘附近。这类方法面对的主要难点是消除模糊及去噪声。而本文结合完整的闪光照相的成像过程,主要关注了闪光照相系统的模糊及噪声对重建结果的影响;讨论了线性模
目的:本次研究主要目的是通过比较杠杆试验中在同一杠杆的支点位置时使足跟抬离检查床面,需要施加在患者健侧与患侧大腿的最小压力数值,用以判断膝关节前交叉韧带损伤中患侧
目的:毒烟吸入所致的急性肺损伤(ALI)是具有较高死亡率的临床急危重症,也是火灾中最致命的因素,但目前对发病机制的研究仍较为匮乏。越来越多的证据表明,微小RNA-155(mi R-155)及
目的乌苏里瓦韦[Lepisorus ussuriensis(Regel et Maack)Ching]为蕨类水龙骨科瓦韦属植物,绿原酸为其主要活性成分,绿原酸具有抗氧化、抗肿瘤、抗菌、抗炎、抗病毒、免疫调节、
近年来,随着各种公共安全、灾害检测、社会反恐等事件的发生,智能监控视频异常事件检测技术在广场、火车站、银行和机场等公共场所中发挥着越来越重要的作用。传统的视频异常事件检测依靠人工对视频信息进行分析处理,但是海量的视频数据大大增加了工作量,这种方式不仅效率低而且容易漏掉可疑目标和异常事件。监控视频异常事件检测的研究可以满足视频数据分析应用中自动实时报警的需求,视频异常事件检测应用融合了图像处理、模式
棘胸蛙(Quasipaa spinosa)隶属于两栖纲无尾目叉舌蛙科(Dicroglossidae)棘胸蛙属(Quasipaa),主要分布于我国南部,少量分布于越南北部地区,具有很高的经济食用价值。前期分子
目的:体外实验研究法舒地尔通过抑制Rho/ROCK信号通路对高糖培养下的人肾小球系膜细胞(Humanmesangialcells,HMCs)炎症反应及其纤维化的影响。方法:代培养的人肾小球系膜细胞
会议
为了探索关于人类自身的编码而启动的人类基因组计划经过近三十年的努力已基本完成。随之而来产生了大量的生物分子数据,这些高维的数据内具有丰富的信息,其背后隐藏着人类尚未充分了解的关于自身的知识。利用数学、统计学与计算机科学相关方法帮助生物学家从海量信息中发现有价值的信息,促进人类医学研究领域的进步,这一迫切需求促进了生物信息学这一学科的快速发展。cDNA微阵列和寡核苷酸芯片等高通量检测技术应用至今已经
目的:本研究旨在探讨经初始治疗后达到完全缓解(CR)或部分缓解(PR),且经CT/MRI证实无脑转移的局限期小细胞肺癌(LS-SCLC)患者从预防性脑照射(PCI)中获益的人群特征及PCI不同给予方式
研究目的:Tim-1是Tim(T cell immunoglobulin domain and mucin domain protein,Tim)家族中第一个被发现的成员,最早发现其表达在激活的CD4+T细胞表面,尤其在Th2型细胞表面有高水平的表达。Tim-1在正常肾脏不表达或低表达,但在肾缺血或急性肾损伤后,Tim-1高表达于肾小管上皮细胞。我们此前利用系统性红斑狼疮(Systemic Lup