论文部分内容阅读
病毒性疾病是严重危害人类健康和生命安全的一大类传染病,历史上几次全球范围的病毒性疾病流行给人类带来了深重的灾难。近年来SARS、HIV、甲型H1N1等病毒的肆虐造成了极大的社会恐慌和难以估算的经济损失,病毒性生物恐怖剂制备技术的扩散也对人类构成了潜在威胁。抗病毒药物在近20年来有了很大发展,但是这些传统抗病毒药物以病毒编码蛋白靶标为主,病毒通过频繁的变异极易适应和逃避药物施加的选择压力,临床应用中存在耐药问题。同时,病毒本身的多样性也给广谱抗病毒药物研究带来极大的挑战。病毒耐药性问题和广谱抗病毒药物设计是目前抗病毒药物研究和开发中的关键问题。由于病毒是严格的细胞内寄生生物,理论上可以通过抑制与病毒生存密切相关的宿主蛋白(即宿主靶标)来达到抗病毒的目的,同时也能很好地避免耐药,但随之而来的问题是如何在大量的宿主细胞蛋白中选择特异的抗病毒药物靶标。目前许多宿主靶标是通过遗传学的手段或者对现有其它用途药物抗病毒效果的评价发现的。这些研究策略筛选范围大、成本高、预期目标不确定,不能成为宿主靶标发现的主流技术。本文基于系统生物学的方法,通过整合高通量的实验数据构建病毒-宿主蛋白质相互作用网络,并针对病毒-宿主蛋白质相互作用网络分析中的关键技术问题进行研究,为抗病毒宿主靶标的辨识提供可行的技术途径。本文首先基于目前蛋白质相互作用数据库以及文献研究报道的蛋白质相互作用数据整理构建了人类细胞蛋白质间、病毒蛋白质间和病毒-宿主间蛋白质相互作用网络。进一步的拓扑分析结果给出了与病毒感染过程可能相关的宿主蛋白及通路。基因表达谱的整合分析需要将不同实验条件和实验环境的多组基因表达谱数据进行统一分析处理。现有的片间校准方法依赖较大的基准数据集或较强的统计分布规律,其正确性不易保证。本文提出了一种基于最小基准集的基因表达谱数据片间校准算法,使得校准方法的正确性易于实验验证。其基本思想是从实验可验证的要求出发,确定最优基准集规模的期望区间,建立数据片间偏差评价函数,然后通过多目标优化方法求解最优基准基因集,同时在优化过程中构建符合基准集期望规模的初始解群,从而有效地提高了求解效率。计算结果表明,本文提出的校准方法在不牺牲校准精度的情况下,将校准所需的基准基因数量显著减少了约两个数量级以上,在实验可验证性上优于现有校准方法。蛋白质相互作用的发生依赖于时间、空间和生物环境等诸多因素,特定时空条件下的细胞内往往只有部分蛋白质发生相互作用,呈现或激活、或抑制等不同状态。激活子网辨识方法有效地结合了基因表达谱和蛋白质相互作用网络数据,在特定时空条件下识别处于激活状态的蛋白质相互作用区域网络,是目前面向生物问题的重要网络分析方法之一。现有方法未能综合考虑基因表达差异性和相关性信息,可能导致辨识结果中重要功能分子缺失且生物学功能相关度不高。本文提出了一种新的辨识激活子网的综合评价准则和多层次的激活子网辨识算法,提高了辨识结果的功能相关性。其基本思想是结合不同实验条件下的基因转录表达差异性和相关性的关联性信息作为激活子网的综合评价准则,并通过迭代优化方法,逐层构建不同规模的激活子网,以便于生物学家对激活子网的结果进行逐步判读。应用于病毒感染过程的计算结果表明,本文提出的算法能够有效辨识显著功能相关的差异基因和表达差异水平较弱但参与重要共表达模块的基因,为辨识病毒感染涉及的宿主蛋白相互作用网络提供了有效工具。从生物功能角度对蛋白质相互作用网络进行比较、搜索、以及聚类等分析均需要首先建立网络功能相似性度量方法。蛋白质的具体生物功能与其所处通路环境相关,而网络拓扑结构这一关联性信息体现了蛋白质所处通路环境。目前研究多集中于单一蛋白质间的相似性度量方法,未能有效考虑蛋白质在不同功能通路上下文中可能对应的不同生物功能角色。本文提出了一种基于邻近蛋白功能相似性和最优匹配原则的网络相似性度量方法,体现了蛋白质在不同网络上下文中的特定功能角色。其基本思想是通过迭代计算方法,将邻近蛋白的功能相似性信息融入蛋白相似度评价中,得到新的局域功能相似性指标,并通过最优匹配算法计算蛋白质网络的功能相似度。应用于KEGG通路数据库和病毒相关激活子网的计算结果表明,本文提出的方法体现了生物功能网络的语义相似性,应用于聚类分析能够取得较好的效果。生物系统内部及外部信号的响应过程往往伴随蛋白质浓度的波动变化。基于质量作用定律构建的传播动力学模型能够较好地体现蛋白质网络中各节点浓度相互依赖的变化。本文首先提出了一种扰动传播衰减因子的近似估计方法,以评估不同情况下的网络扰动传播衰减速度。计算表明扰动衰减速度与初始扰动强度、结合强度之间存在着负相关关系,体现了网络传播过程对于高强度扰动具有天然的抑制效应。随后提出了基于扰动覆盖模型的扰动源辨识方法,可用于辨识特定调控过程中的关键分子。其基本思想是利用整数规划模型,寻找扰动覆盖范围匹配最优的扰动源蛋白质集。应用于病毒感染过程的计算结果表明,基于扰动覆盖模型辨识方法能够较好地定位参与病毒感染过程的宿主关键分子,在大规模抗病毒药物候选宿主靶标筛选中具有其应用价值。