基于时间序列大数据的基因表达调控网络推断方法研究

来源 :内蒙古农业大学 | 被引量 : 0次 | 上传用户:kent10211021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因果关系超越了相关性关系,它揭示了数据变量中一个变量引起另一个变量的变动模式。目前因果关系推断在许多领域中都得到了广泛研究,并成为一种了解和探索复杂系统内在驱动关系的有效方法。在生物信息学领域中,基因表达调控网络重构是因果关系推断中最典型的前沿性研究问题之一。生命体系统是一个非常复杂的整体运行结构。生命体中的基因不仅不是孤立存在的,而且基因之间具有特别复杂的交互调控关系。研究基因表达调控网络不但有助于了解细胞生命过程的运作机制,还有助于揭示生命过程的奥秘,为复杂疾病的治疗提供新的思路。基因调控网络的理解和探索已被证明在疾病诊断和基因组药物设计中具有重要作用。它还可以形象展示基因转录变化的动力学和生物生理状态,在理解表型性状的遗传基础中扮演着重要的作用。然而,如何推断和构建有效、可靠的基因表达调控网络仍然是一个研究难点。尤其在推断更大规模的基因调控网络关系时,对现有的基因表达调控网络构建方法带来了更大的挑战。本文的主要工作内容和研究成果如下:(1)针对目前基因表达调控网络构建方法的局限性,本文提出了基于时间序列基因表达大数据和转移熵的基因表达调控网络构建方法GRNTSTE(Gene Regulatory Networks Based on Time Series Data and Transfer Entropy,GRNTSTE)。该方法以转移熵理论为核心,通过计算分析大规模时间序列基因表达数据,从而推断基因之间的因果调控关系,进而构建基因表达调控网络。为了验证GRNTSTE方法的性能和有效性,本文基于开源的数据集DREAM3挑战和IRMA OFF/ON数据集进行实验验证,并与现有最为有效基因表达调控网络构建算法进行了对比分析,实验结果证明了GRNTSTE方法具有更好的性能和灵敏度。(2)作为生物体节律中枢松果体的活动有明显的周期性特点,科学家发现松果体可以通过分泌激素的形式将“时间信号”传达于中枢神经系统,从而调控生物机体的节律生物钟。现研究表明松果体分泌的褪黑激素昼夜间成周期性变化,对调解生物机体的睡眠和觉醒具有重要作用。因此,了解和探索褪黑激素的分泌机制对治疗人们睡眠异常问题等具有重要意义。本文将GRNTSTE方法应用于内蒙古自治区大数据研究与应用重点实验室采集的大鼠松果体组织的时间序列基因表达大数据集,并提出了完整的大鼠松果体节律基因表达调控网络构建框架,该分析框架包涵6个步骤,分别为时间序列基因表达数据采集;时间序列基因表达数据预处理;特征基因选择;计算成对基因间的转移熵;基因调控关系筛选;基因表达调控网络构建。基于该框架有效的构建了大鼠松果体组织节律基因表达调控网络,为生物验证实验提供了有价值的参考依据,对深入探索松果体中褪黑激素分泌机制具有重要意义。(3)针对GRNTSTE方法在构建基因表达调控网络中转移熵计算效率低和耗时长的问题,本文提出了基于Spark大数据技术的可扩展转移熵并行计算方法,该方法采用大数据分布式计算思想,将整体计算任务划分为多个独立子任务,并分发于Spark集群的不同计算节点,进行分布式并行计算,从而大幅度的提高了转移熵的计算效率。最后,本文针对课题的研究结果进行了总结分析,并指出当前方法中有待优化的环节和下一步研究展望。
其他文献
期刊
真空冷冻干燥作为最常用的菌种保藏方法,已被广泛应用于乳酸菌发酵剂的工业化生产中,但干燥过程中菌体仍不可避免的受到低温、酸、脱水和氧化等多种不利因素的影响,造成菌体损伤甚至死亡。目前,对真空冷冻干燥过程中氧化应激导致细胞损伤和活力降低的研究鲜有报道。本研究以乳双歧杆菌Probio-M8作为研究对象,从乳清蛋白水解物中分离得到的抗氧化肽HP3-2作为冻干保护剂,探究真空冷冻干燥过程中氧化应激对细胞膜结
学位
集约化饲养是我国肉羊产业的发展趋势,现已明确饲养方式会影响羊肉品质,但尚不清楚这种影响是否会持续到宰后成熟过程。宰后成熟是完成肌肉嫩化,提高肉品质的重要过程,同时参与肌肉嫩化的细胞凋亡也会在此过程中发生。因此,本研究基于细胞凋亡通路探究饲养方式(放牧与舍饲)对羊宰后成熟过程中肌肉生化代谢和肉品质的影响。本试验以不同饲养方式下的蒙古羊为研究对象,选取背最长肌置于4℃条件下进行宰后成熟,分别于0、1、
学位
乳酸菌作为食品工业和人体肠道中重要的微生物,易受到环境变化的影响,而生物膜的存在可有效提高乳酸菌抗逆性。但是群体感应系统调控其生物膜形成的机制尚不明确。本研究通过筛选具有较高成膜特性的有益乳酸菌并进行鉴定,同时以菌株不同生长状态为基础,分析其对不良环境的耐受性及产信号分子AI-2的能力,探讨菌株抗逆性与信号分子AI-2之间的关系;然后基于全基因组数据分析对信号分子AI-2关键基因luxS进行敲除,
学位
唐古特白刺(Nitraria tangutorum)是我国西北地区广泛分布的防风固沙植物,其防风阻沙效果与株丛形态及配置方式关系密切。本研究对天然分布的唐古特白刺进行了大量的调查,从枝叶性状入手,分析株丛形态对坡向、坡位、立地类型及沙埋环境的响应;并以该结果为依据,采用控制试验的方法,深入探讨唐古特白刺枝叶性状及株丛形态对水分条件、盐碱胁迫、沙埋深度、机械损伤的响应规律,为人工诱导唐古特白刺得到理
学位
由于奶牛场不科学及不合理地使用抗菌药物,导致大肠杆菌出现了较为严重的耐药性。因此,开展犊牛腹泻致病性大肠杆菌的流行病学调查研究,并分析毒力基因和耐药基因的分布情况具有重要意义。本研究以呼和浩特地区周边养牛场的犊牛腹泻病例为研究对象,采用分子生物学和生化鉴定的方法对大肠杆菌进行分离和培养,并对所分离出的21株大肠杆菌的毒力基因和耐药基因的分布情况进行分析。在此基础上,针对筛选出具有高致病性和耐药性的
学位
四合木(Tetraena mongolica Maxim)作为地中海时期的孑遗植物,耐寒耐旱的优良基因使其成为鄂尔多斯高原草原化荒漠区的重要建群种植物。长期的适应性生存使四合木呈现出特定的构型特征,构型的改变也使其冠层下形成大小各异的稳定沙堆。荒漠灌丛沙堆的沉积和消亡将直接影响灌丛的生长和群落的保护,当前亟需明确四合木植株构型对风沙过程和沉积特征的影响机理。本文以鄂尔多斯高原西北部草原化荒漠区的四
学位
畜牧业是蒙古国最重要的经济部门之一,其产值占国内生产总值的9.3%,从牧人员占总劳动力的30%。纵观几个世纪漫长的历史发展过程,蒙古国一直坚持并传承草原畜牧业的游牧生产生活方式,因此易于遭受自然灾害、疫病危害、市场冲击和政策变化的影响。特别是自2000年以来,自然灾害发生率上升,造成的损失也在加重,给畜牧业生产和牧民生计产生巨大的负面影响。近年来,包括蒙古国在内世界各国都非常重视农牧业风险及其管理
学位
气温突变与变暖停滞是气候变化中两个重要的变化状态,对水资源、生态环境等都会产生一定影响,其大尺度时空变化特征与规律,特别是成因与机制目前尚不明确,而气温是否发生了真正的变暖停滞尚存在一定的争议。气温亦参与并影响水文过程,在去除对地表径流影响相对重要的降水、蒸发、人类活动等因素的影响后,气温突变与变暖停滞对地表径流有多大影响?探索揭示这个影响是否能为诸如天然流域降水平稳而径流大幅减少等径流与主要影响
学位
在奶牛乳房炎的防治领域内,植物提取物是最具潜力的抗生素替代品之一。本文通过研究中草药提取物复合制剂对乳房炎奶牛的影响及初步机理,为植物提取物在奶牛养殖业中的应用提供理论数据和技术支持。本研究通过饲养试验验证了中草药提取物复合制剂对奶牛生产性能的影响;对患有乳房炎奶牛免疫抗氧化水平及瘤胃细菌群落组成的影响;最后应用乳腺上皮细胞体外培养方法初步探究了中草药提取物复合制剂对LPS诱导炎症损伤的奶牛乳腺上
学位