病毒—宿主蛋白质相互作用网络计算分析关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:chengczl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
病毒性疾病是严重危害人类健康和生命安全的一大类传染病,历史上几次全球范围的病毒性疾病流行给人类带来了深重的灾难。近年来SARS、HIV、甲型H1N1等病毒的肆虐造成了极大的社会恐慌和难以估算的经济损失,病毒性生物恐怖剂制备技术的扩散也对人类构成了潜在威胁。抗病毒药物在近20年来有了很大发展,但是这些传统抗病毒药物以病毒编码蛋白靶标为主,病毒通过频繁的变异极易适应和逃避药物施加的选择压力,临床应用中存在耐药问题。同时,病毒本身的多样性也给广谱抗病毒药物研究带来极大的挑战。病毒耐药性问题和广谱抗病毒药物设计是目前抗病毒药物研究和开发中的关键问题。由于病毒是严格的细胞内寄生生物,理论上可以通过抑制与病毒生存密切相关的宿主蛋白(即宿主靶标)来达到抗病毒的目的,同时也能很好地避免耐药,但随之而来的问题是如何在大量的宿主细胞蛋白中选择特异的抗病毒药物靶标。目前许多宿主靶标是通过遗传学的手段或者对现有其它用途药物抗病毒效果的评价发现的。这些研究策略筛选范围大、成本高、预期目标不确定,不能成为宿主靶标发现的主流技术。本文基于系统生物学的方法,通过整合高通量的实验数据构建病毒-宿主蛋白质相互作用网络,并针对病毒-宿主蛋白质相互作用网络分析中的关键技术问题进行研究,为抗病毒宿主靶标的辨识提供可行的技术途径。本文首先基于目前蛋白质相互作用数据库以及文献研究报道的蛋白质相互作用数据整理构建了人类细胞蛋白质间、病毒蛋白质间和病毒-宿主间蛋白质相互作用网络。进一步的拓扑分析结果给出了与病毒感染过程可能相关的宿主蛋白及通路。基因表达谱的整合分析需要将不同实验条件和实验环境的多组基因表达谱数据进行统一分析处理。现有的片间校准方法依赖较大的基准数据集或较强的统计分布规律,其正确性不易保证。本文提出了一种基于最小基准集的基因表达谱数据片间校准算法,使得校准方法的正确性易于实验验证。其基本思想是从实验可验证的要求出发,确定最优基准集规模的期望区间,建立数据片间偏差评价函数,然后通过多目标优化方法求解最优基准基因集,同时在优化过程中构建符合基准集期望规模的初始解群,从而有效地提高了求解效率。计算结果表明,本文提出的校准方法在不牺牲校准精度的情况下,将校准所需的基准基因数量显著减少了约两个数量级以上,在实验可验证性上优于现有校准方法。蛋白质相互作用的发生依赖于时间、空间和生物环境等诸多因素,特定时空条件下的细胞内往往只有部分蛋白质发生相互作用,呈现或激活、或抑制等不同状态。激活子网辨识方法有效地结合了基因表达谱和蛋白质相互作用网络数据,在特定时空条件下识别处于激活状态的蛋白质相互作用区域网络,是目前面向生物问题的重要网络分析方法之一。现有方法未能综合考虑基因表达差异性和相关性信息,可能导致辨识结果中重要功能分子缺失且生物学功能相关度不高。本文提出了一种新的辨识激活子网的综合评价准则和多层次的激活子网辨识算法,提高了辨识结果的功能相关性。其基本思想是结合不同实验条件下的基因转录表达差异性和相关性的关联性信息作为激活子网的综合评价准则,并通过迭代优化方法,逐层构建不同规模的激活子网,以便于生物学家对激活子网的结果进行逐步判读。应用于病毒感染过程的计算结果表明,本文提出的算法能够有效辨识显著功能相关的差异基因和表达差异水平较弱但参与重要共表达模块的基因,为辨识病毒感染涉及的宿主蛋白相互作用网络提供了有效工具。从生物功能角度对蛋白质相互作用网络进行比较、搜索、以及聚类等分析均需要首先建立网络功能相似性度量方法。蛋白质的具体生物功能与其所处通路环境相关,而网络拓扑结构这一关联性信息体现了蛋白质所处通路环境。目前研究多集中于单一蛋白质间的相似性度量方法,未能有效考虑蛋白质在不同功能通路上下文中可能对应的不同生物功能角色。本文提出了一种基于邻近蛋白功能相似性和最优匹配原则的网络相似性度量方法,体现了蛋白质在不同网络上下文中的特定功能角色。其基本思想是通过迭代计算方法,将邻近蛋白的功能相似性信息融入蛋白相似度评价中,得到新的局域功能相似性指标,并通过最优匹配算法计算蛋白质网络的功能相似度。应用于KEGG通路数据库和病毒相关激活子网的计算结果表明,本文提出的方法体现了生物功能网络的语义相似性,应用于聚类分析能够取得较好的效果。生物系统内部及外部信号的响应过程往往伴随蛋白质浓度的波动变化。基于质量作用定律构建的传播动力学模型能够较好地体现蛋白质网络中各节点浓度相互依赖的变化。本文首先提出了一种扰动传播衰减因子的近似估计方法,以评估不同情况下的网络扰动传播衰减速度。计算表明扰动衰减速度与初始扰动强度、结合强度之间存在着负相关关系,体现了网络传播过程对于高强度扰动具有天然的抑制效应。随后提出了基于扰动覆盖模型的扰动源辨识方法,可用于辨识特定调控过程中的关键分子。其基本思想是利用整数规划模型,寻找扰动覆盖范围匹配最优的扰动源蛋白质集。应用于病毒感染过程的计算结果表明,基于扰动覆盖模型辨识方法能够较好地定位参与病毒感染过程的宿主关键分子,在大规模抗病毒药物候选宿主靶标筛选中具有其应用价值。
其他文献
脂肪瘤是软组织尤其是中胚层最常见的良性肿瘤之一。脂肪组织在人体分布很广,凡有脂肪组织的部位均可发生脂肪瘤,但最常发生于皮下脂肪组织内,体表最常见的部位是肩部、背部
职业院校专业课程的教学改革一直以来都是一线教育工作者关注的焦点。游戏教学作为一种教学辅助手段,不仅可以在中小学课堂上施加影响,也可以在职业院校的课堂上大展拳脚。本
12个抽样城市畜产品平均批发价格,牛肉最高(表1),其次是羊肉和猪肉,鸡肉最低。猪肉地区差价最大,中部分别高于东、西部23.7%和24.3%;其次,羊肉批发价,东部和西部分别高于中部21.1%和20.4%。牛
石灰石-石膏烟气脱硫技术因其脱硫效率高、可靠性强、对煤种适应能力强、吸收剂资源丰富、副产物可综合利用、工艺成熟等优点,而被广泛应用.脱水系统作为脱硫系统重要的分系
结核病是由结核分枝杆菌引起的一种世界性传染病。世界卫生组织2004年的世界卫生报告指出结核病已经成为可治疗的感染性疾病当中的头号致死性疾病。WHO感染性疾病的死亡登记
心肌肥大是心肌细胞对多种病理因素的代偿性反应,但慢性心肌肥大参与了扩张性心肌病、心力衰竭、猝死等多种心血管疾病的发生、发展过程,严重危及人类生命;因此阐明心肌肥大的
该文主要介绍了基于故障预警实现发电设备状态检修的最新实践。为达到以设备可靠性为基础、以经济性为主导的状态检修模式,浙能集团采用云计算和相似性原理(SBM)建模技术,构建
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
通过对1987、1993、1999、2006和2010年5个时相的Landsat卫星遥感数据分析,利用适合长江口岸线演变研究的遥感波段组合,获得了长江口南北两岸20多年来岸线演变的信息,结果表
为研究地铁列车运行引起的轨道系统及饱和土体动力响应问题,采用解析法建立了饱和土全空间中圆形衬砌隧道和轨道结构耦合分析模型,用一系列符合列车几何尺寸的移动常荷载或移