基于网络的复杂疾病生物标记物识别的模型与算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:iovewpycoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
二十一世纪以来,生命科学进入了前所未有的高速发展阶段,高通量技术催生的多种组学数据和大量的临床实验数据为人们从系统的角度分析复杂疾病发生、发展的机理机制提供了条件。识别疾病特异性强、高精度的生物标记物可以对疾病的早期筛查、精确诊断、疾病治疗方案的选择、预后效果的评价、药物设计等方面提供巨大的帮助,为人类疾患的诊治开辟全新的途径。生物标记物识别是疾病预防和控制的重要课题,寻找和发现全新的有价值的生物标记物已成为生物信息学的一个研究热点,并引起了社会和临床医学界的广泛关注。  本论文旨在采用运筹学、统计学和生物信息学的研究方法,从高通量组学数据和生物分子网络出发构建识别生物标记物的模型与算法,并分析识别出的生物标记物所具有的性质,推断疾病可能的发病机制和致病机理。本文得到的主要研究结果包括:  (1)对现有的生物标记物识别方法进行详细的文献综述,较为全面地介绍了目前对生物标记物识别问题的研究现状,并依据不同模型与算法所使用的数据类型将现有方法分为传统的生物标记物识别方法与基于网络的生物标记物识别方法,分析各类方法的优缺点,同时对其中具有代表性的方法进行详细介绍。  (2)详细和完整的介绍了空间内的随机游走和图上的随机游走,对随机游走的理论框架进行深入讨论。重点给出了带重启的随机游走在生物信息学里的应用,并从扩散先验信息影响和整合多种类型数据两个角度对现有实例进行分析。  (3)用基因协同网络这一全新的概念来对基因之间的互补协同能力建模,提出了一个基于基因协同网络的生物标记物识别方法——MarkRank方法。通过在模拟数据和真实数据上的分析,发现MarkRank方法相比于其他方法有着较高的分类精度,且在疾病同质性和异质性的情形下均可识别出有效的生物标记物。此外,MarkRank识别出的标记物不仅有着较强的疾病特异性和显著的网络连通性,而且能参与到相应疾病的一些重要的生物过程,有着恰当的生物学解释。  (4)综合使用五种癌症的表达数据集,构造具有高度异质性的癌症表达图谱,并结合生物分子网络信息来深度挖掘癌症共有的标记物基因。通过将癌症共有的标记物基因与不同类型癌症特异性结果的比较,推断癌症可能的发病机制和致病机理。
其他文献
  文中所研究的图均为简单图,有关的记号和术语请看参考文献。一个长为l的圈称为(smodk)-圈是指l≡smodk,其中k和s均为整数。图G称为模k泛圈的是指对任意的s(0≤s<k),它都包含(
本文研究一类更一般的特征值问题-div(a(x)▽u)+b(x)u=λuinΩ,u=0on()Ω并得到特征值和特征函数的L2模和L∞模估计(见以下(1)-(6)式).首先利用该问题所对应的稳态问题解的存
水库湖泊是陆地水文系统中重要的淡水蓄积体,与人类的生活密切相关,它不仅是人类重要的饮用水源之一,同时还具有调节河川径流防洪减灾、农业灌溉、水产养殖以及发电旅游等重要的使用功能。 我国湖泊水库星罗棋布,类型繁多,随着我国工业生产的发展和都市化程度的提高,若不积极采取相应措施,水体富营养化将日趋严重。为了保护水库湖泊的水质,科学地利用水资源,必须对水库湖泊的富营养化状况进行有效的监测、评价与预测
本文通过对国内外油气井优化配产方法的调研和分析,从气井生产压力的整体系统入手,对处于同一水动力学系统的采出流体,经过对实际系统进行简化和抽象后,抽取系统中压降与流量
本文的主要研究对象是完美非线性映射(函数)(PerfectNonlinearfunction-PN)。在第一节给出PN的定义,性质和研究PN所用的几种主要工具:相对差集,建筑组,Bent函数,Galois环的介绍;第
本文主要研究三维Lorentz空间的共形曲面论,给出完全的共形不变量系统,并相应的给出一些特殊曲面的分类。设R31是三维Lorentz空间。如果在R31的无穷远处添加一个光锥C∞,则得到R
学位
学位
1892年,俄国数学力学家李雅普诺夫(Lyapunov)在他的博士论文《运动稳定性的一般问题》中给出了稳定性的严格数学定义和一般方法,从而奠定了稳定性理论的基础.随着科技的进步,李雅
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊