论文部分内容阅读
随着人类基因组计划的基本完成,生命科学研究进入了”后基因组”时代。在后基因组时代面临的一个重大挑战就是如何从整体层面上揭示生物系统中DNA、RNA、蛋白质和各种生物小分子通过相互作用而产生生命现象。在这一背景下产生了系统生物学,它是一门新兴交叉学科,其目的在于在系统层次上理解生物系统。由于生物系统的内在复杂性要成功地进行系统生物学研究,必须借助数学建模和计算机仿真的方法。建模和仿真生物体和细胞是非常困难的,其原因在于:首先,生物内在的复杂性和生物实验技术的限制,导致生物的知识和实验数据不足;其次,对于复杂的生物过程,发展新建模和仿真的方法来研究复杂的生物系统成为生物学面临的一个重要的挑战。针对当前的需求,本文提出多源数据整合与agent技术结合的方法来研究生化网络,主要研究内容包括:1.构建数据整合对于系统生物学研究是非常重要和有帮助的,本文提出一种以生化网络模型为中心的多源数据整合方法,基于此方法构建了一个面向具体生物问题的数据整合平台(BioDB)。它是面向生物具体的问题,围绕选定具体问题将相关的生物数据库进行整合。其次,它是以生物网络模型为中心来构建的数据整合系统,将相关的生物数据库、文献知识、专家知识、生物实验数据和仿真实验数据围绕生物模型来整合。实验显示BioDB为重构代谢网络提供一个有效的数据平台,使得重构不但拥有更好的结果,而且具有快速、高效的特点。2.针对生物数据标准无法共享应用的问题,本文提出一种将生物数据进行标准转换的方法(BioBridge),它为生物Pathway数据标准之间提供了一个稳定的桥梁,使得数据可以跨越标准进行共享和使用。数据联邦整合方法中数据访问的效率一直是研究的重要问题,我们提出一种基于有限记忆多LRU的web缓存替换算法来构建了基于web缓存的数据联邦系统(LinkDB),有效的提高了在线的获取数据的效率。3.现阶段对生物系统的建模和仿真技术和方法需要进一步的发展,大多数现有的方法致力于简单生物学过程的建模和仿真。本文提出了一种在分子尺度上基于agent的建模方法,基于此方法构建了一个基于agent技术的计算平台来分析生化网络。该方法通过研究agent行为自组织突生形成的复杂宏观现象,来揭示生物系统的内在机制和宏观复杂现象和微观分子行为之间的联系。4.通常的,实际的生物系统具有很高的复杂性,这给建模和仿真生化网络的方法提出了更高的计算要求。本文基于agent技术和并行化思想提出的一种分布式的随机仿真方法(DSSA),算法主要是通过将Gillespie的SSA算法有效的分解到基于多agent系统的分布式框架中,同时应用反应关系图来进一步的减少计算和通讯代价。实验显示DSSA算法在时间性能上带来很大的提升,特别是对于一些大型的生化网络系统。应用通过多源数据整合的基于agent建模的方法对于生化系统加以研究不仅具有巨大的理论价值,还具有广阔的应用前景,本文在通过多源数据整合来建模和仿真分析生化网络系统的体系下做了一些研究工作,如何进一步完善现有的方法和平台,研究生物系统内在的演进机制是我们未来的方向。