非平稳基因调控网络的构建

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:andyylaopo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因调控网络的构建是功能基因组研究中最具挑战性的课题之一,是目前生物信息学的研究热点。微阵列技术的发展,为基因调控网络的研究提供了数据基础。通过利用机器学习和计算机算法构建基因调控网络,可以帮助了解生物细胞和组织之间复杂的调控关系,发现细胞内的调控模式,进而在系统尺度上理解生命进程。基于贝叶斯理论的图模型以其坚实的理论基础,知识结构的自然表述,灵活的推理能力以及方便的决策机制使其应用范围越来越广泛,成为了构建基因调控网络的一种有力工具。  针对当前基因调控网络构建研究中的热点问题,本文开展了基于非平稳数据基因调控网络构建的研究,主要的研究成果和创新点如下:  (1)由于基因表达数据受芯片数量、质量、实验设计、噪声和测量误差等因素的影响,其数据中所含的信息是有限的。针对这一特点,本文通过引入网络能量函数,提出了一种多源数据融合的方案。该方案主要采用了两种方法来融合多种生物先验知识的数据源。第一种方法是直接把多种生物先验知识通过各自的网络能量函数来进行融合;第二种方法是先把多种的生物先验知识通过D-S证据理论进行组合,然后再运用网络能量函数实现融合。  (2)利用动态贝叶斯网络进行建模的时候是限制在时间序列数据产生的分布是平稳的这一条件下进行的。针对这一限制,本文提出了一种基于多源数据融合构建非平稳基因调控网络的算法。该算法在高斯混合模型中,结合网络能量函数和改变点过程,利用可逆跳跃马尔科夫蒙特卡罗抽样算法,把整个非平稳过程分解成若干平稳的子片断,推断网络参数随时间变化的网络结构,以及先验数据对网络的影响,从而提高了重构网络的可靠性和覆盖率。  (3)针对基因调控存在时延和基因调控网络结构随时间变化的客观现象,本文提出了一种构建时变结构的非平稳基因调控网络的算法。该算法引入了基因调控时延机制,利用时延互信息计算出各基因对之间的最大时延,借助L1正则化Logistic回归模型和高阶线性回归模型来学习网络结构随时间变化的基因调控网络。  本文针对不同的问题,提出了相应的解决办法和算法,对非平稳基因调控网络的构建方法进行了深入探讨。在仿真数据和实验数据上测试这些算法,并对所构建的基因调控网络进行性能评价。通过与已有方法的比较和生物学意义的分析,证明了本文所提出的基因调控网络构建方法的有效性。
其他文献
"发动机试验台架测控系统的研究"是一项技术要求高、难度大、并具有理论研究价值的工程项目.该文论述了该系统的硬件配置及原理、实时控制软件的原理以及控制算法.并对工业现
斑马鱼是一种新兴的模式生物,近十几年来,以斑马鱼为模式生物的研究在脊椎动物胚胎发育的研究领域获得了长足进展。斑马鱼作为模式生物有着不可替代的优势,它价格便宜,容易获得,体
该文研究了子波变换在自适应快速算法中的应用.将子波变换用于自适应算法,主要是由于在子波变换具有时域局域性,对信号作变换具有去相关的性质,即可产生稀疏的相关阵结构.该
燃料乙醇是最有发展前景的新型可再生能源,其生产和应用因在经济发展和战略安全上的重大意义,越来越受到各国政府的重视。自然界中含有丰富的植物纤维资源,而目前只有3-4%的植物
DS-CDMA系统的优势主要表现在它的大容量特性,远近效应和多址干扰是限制该系统容量的主要因素.传统检测器的抗远近效应和抗多址干扰性有明显缺陷,多用户检测技术针对这一缺点
在无线蜂窝系统中,小区边缘的干扰成为了限制系统容量的主要因素。干扰对齐算法是有一种能够有效抑制干扰、提高系统容量的方法。小区干扰对齐算法通过预编码,将来自其它小区
学位
着丝粒是真核生物染色体重要的结构元件。在细胞有丝分裂和减数分裂时期,着丝粒精确调控染色体的配对与分离并维持染色体结构的稳定。植物着丝粒DNA序列主要由卫星序列和反转录转座子构成。着丝粒功能极其保守,但物种间DNA序列的变异性较大,呈现一种快速进化的模式。甘蔗是重要的糖料作物,其糖产量约占全球的四分之三。目前,甘蔗野生种割手密(Saccharum spontaneum)的全基因组测序工作已启动。然而
学位
该文借鉴了已有的基于模糊系统和神经网络的火灾探测系统的结构,同时发现它们存在的问题.在此基础上,将模糊系统和神经网络有机地结合起来,提出了一些新型的模糊神经网络结构