基于贝叶斯理论的基因调控网络建模研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:joeyifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微阵列技术的发展,为基因调控网络的研究提供了数据基础,基因调控网络的构建是功能基因组中一个重要研究课题。基于贝叶斯理论的图模型具有坚实的理论基础、简单明了的知识表示、灵活的推理机制,是构建基因调控网络的一种强有力工具。基于贝叶斯理论的图模型,针对当前基因调控网络研究中存在的问题,本文的贡献如下:针对单个基因表达数据集中样本点缺乏问题,提出了分布式的MFD-GRN算法,融合了多个分布的静态基因表达数据集,构建基因调控网络,各个分布的数据集中含有相同的基因,不同数目的样本点。MFD-GRN算法分为两个过程:局部学习和全局学习。在局部学习中,利用搜索评分的方法,从每个基因表达数据集中,分别独立的学习贝叶斯网络结构;在全局学习中,基于相关性分析的方法融合局部结构,在融合过程中,把贝叶斯网络中节点对的互信息和条件互信息看作变量,取它们的数学期望,作为全局学习的评价标准。这样只传递了局部互信息和条件互信息到融合结点,没有直接获取局部个体数据,有效地保护了个体的隐私。针对时间序列基因表达数据,基于连续的动态贝叶斯模型,提出了TSMI-GRN算法,构建基因调控网络。TSMI-GRN算法定义了基因间的时序互信息,利用协方差矩阵计算时序互信息,并且考虑了其它所有基因对这两个基因间互信息的影响,与传统的互信息比较,增加了时间特性,与基因表达数据的特点相吻合。针对基因调控网络会随时间变化而变化的问题,基于变结构的动态贝叶斯模型,提出了VS-GRN算法,融合多源数据构建变结构的基因调控网络。该算法分为三阶段。第一个阶段:分割多元时间序列为若干个平稳时间片。我们定义了一个平稳性测量函数,提出了一个平稳性分割算法。第二个阶段:在每个平稳时间片中学习贝叶斯网络。提出了P-BIC评分函数,融合了基因表达数据和蛋白质-蛋白质相互作用数据,来学习贝叶斯网络。第三个阶段:在相邻平稳时间片间学习转移网络。本文针对不同的问题,基于贝叶斯理论的图模型,提出了三个学习算法,对基因调控网络的构建方法进行了深入探讨,并在真实的基因表达数据集上,测试了这些算法,将学习结果与已有的贝叶斯模型算法进行了比较,分析了算法的生物学意义及有效性。
其他文献
目的探讨早期活动对ICU机械通气患者谵妄的临床干预效果。方法选择我院综合ICU行机械通气的患者85例为研究对象,随机分为常规组和研究组,常规组采用常规护理干预及使用镇静药
食管癌是全球最常见的恶性肿瘤之一,根据病理类型可分为食管鳞状细胞癌(Esophageal Squamous Cell Carcinoma,ESCC)和食管腺癌(Esophageal Adenocarcinoma,EAC)。食管癌也是
事实上离散数学大致可以被认为是抽象化了的计算机问题,数据结构与算法设计中都能够体现出离散性。计算机里能够表现离散性的问题有很多,因此计算机科学在研究离散数学时有多
经典的整数阶扩散方程最早由德国生理学家Fick在研究营养物质在生物细胞膜内的传播过程时提出,并随后由Einstein与Pearson分别运用第一性原理和随机游走的方法导出。他们的工
保险素有“社会稳定器”之称,其作为一项分散风险,分担损失的社会制度对人类社会的稳定和发展意义重大。随着生产力的提高和人类社会文明的进步,保险受到越来越多的重视,社会
当前大学生就业形势十分严峻,毕业生的就业压力大。在这种情况下,作为学生和用人单位之间的桥梁,学院的帮扶工作就显得尤为重要。在学院开展的就业帮扶工作中,以学生就业存在
农村老年人能否老有所养是关系到社会稳定、农村深化改革、“三农”问题妥善解决以及实现全面小康社会目标的重要问题。党的十七大明确提出,要加快建设覆盖城乡居民的社会保
目的探讨乳酸杆菌对卵白蛋白致过敏性鼻炎(AR)大鼠的鼻分泌物嗜酸性粒细胞(EOS)、血清中IgE、IL-4和IFN-r含量的影响。方法以OVA为致敏原建立大鼠AR模型,实验分正常组、模型
在过去的20余年里,食管癌总的生存率仍然处于一个较低的水平,在接受根治性切除的食管癌病人中,超过三分之二最后会因复发及远处转移而死亡。在亚洲地区食管鳞状细胞癌(Esopha
为了揭示歧口凹陷古近系岩性地层油气藏分布规律并指导钻探,应用层序地层学理论,结合三维地震、测井和岩心资料对岐口凹陷滨海地区古近系开展了层序地层分析。古近系作为一个