基于热扩散模型的致病基因预测方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:ssqjwz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着生物信息学领域的迅速发展以及应用,人们获取了海量的生物数据,如何从这些海量数据中挖掘出有价值的生物信息,逐渐成为生物信息学领域的研究热点。高通量生物技术的发展为致病基因的预测提供了海量的数据来源,尤其是蛋白质相互作用网络和疾病表型相似性网络等为代表的生物网络很好地表示了基因和疾病之间的复杂关系,为致病基因预测提供了强有力的支撑。当前大部分基于计算的致病基因预测方法采用了"guilt-by-association"假设,即表现型相似的疾病往往是由功能相关的基因引起的,并且相关研究已经证明同类疾病相关的基因产物之间发生物理相互作用的概率更高。虽然这些方法在致病基因预测中取得了不错的成绩,但其预测效果仍有提升的空间。因此,本文基于热扩散和多源异构数据模型来研究致病基因预测问题,主要研究工作如下:第一,当前大部分致病基因预测方法把网络中的孤立节点当成网络噪音,因此这些算法并不能很好地预测网络中的孤立节点。并且现存的方法在预测致病基因时,往往更偏向于网络中度比较大的节点,而对于网络中的稀疏节点来说,效果不是很理想。针对上述问题,本文提出了一种基于热扩散模型和排名一致性原则的致病基因预测方法NDRC,对1931个疾病的所有已知致病基因进行留一法交叉验证。实验结果表明在预测度比较小的节点和孤立节点方面,NDRC算法性能好于另外三种致病基因预测方法RWR、VAVIEN和PRINCE。最后,将本文提出的致病基因预测方法NDRC方法用于麦克尔综合征1、蛋白C缺乏症和过氧化物酶体生物合成障碍1A,发现复杂疾病的致病基因呈现明显的模块特征。第二,由于高通量得到的生物数据还远远不够完善,这些数据存在严重的假阳性和假阴性问题,因此仅仅使用一种生物数据还不能很好地预测致病基因。为了提高致病基因的预测精度,本文提出了一种基于热扩散和多源异构数据融合的致病基因预测算法NDHD。NDHD算法融合蛋白质相互作用网络、疾病表型相似性网络和蛋白质结构域网络来预测致病基因。实验结果表明NDHD算法在验证已知致病基因和预测新致病基因方面效果好于ProphNet算法。
其他文献
目前,经皮椎体成形技术、经皮椎体肿瘤活检技术、经皮颈、腰椎间盘切除技术已经成熟;而经皮基因细胞工程治疗、经皮有限半径的放射治疗、椎体骨折脱位的复位固定治疗等治疗技术
随着社会的进步和Internet的迅速发展,人们对于自主学习和终身学习的要求越来越强烈。网络和人工智能等技术的发展及其在教育领域的应用,带来了教育观念、教学方法和手段等的深
针对并发程序中存在的主要缺陷类型,目前的研究包括单一类型的缺陷检测的技术和通用的多种类缺陷检测技术,而这些技术均存在各自的不足之处,例如会产生组合爆炸问题,虚假警报
相比于常规的应用软件系统,信息服务平台类系统开发难度大、复杂度高,设计开发周期长,而具体的软件技术变化快,平台系统的设计速度往往赶不上关键技术的变化速度。本文从设计模式
随着Internet的迅猛发展,计算机网络大大地影响了人类的生活方式、商业模式。作为互联网最主要应用的Web正成为整个世界的窗口,它实现了全球用户和各种信息的共享。Web上各种各
伴随着互联网的飞速发展,当前社会早己进入信息时代。各个行业的从业者都需要从数据当中发现有价值的信息,将海量数据转换成有价值的信息和知识已经成为当今社会的迫切需要,
针对电力系统设备种类多,操作项目繁杂,导致人为误操作屡有发生的现状,本课题基于新兴的无线射频技术(RFID),开发出一种便携式监督器。将已有的电力两票软件扩充为一个软、硬件结
当网络安全越来越受到人们的重视之后,防火墙、入侵检测系统也得到越来越广泛的研究与应用。而入侵检测系统可以弥补防火墙的不足,实时地检测网络入侵行为,并且在发现入侵的
排课问题是一个有约束、多目标的组合优化问题,并且已经被证明为是一个NP完全问题。遗传算法是一种借鉴生物界自然选择和进化机制发展起来的高度并行、自适应的随机搜索算法,是
嵌入式产品正以不可思议的速度闯入人们的日常生活。MP3、MP4、智能家电、智能手机等电子产品到处可见。嵌入式系统也逐渐成为当前最热门的研究方向之一。这些现象表明,嵌入