基于结构域信息的蛋白质复合物识别与疾病基因预测

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:gundamet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质及其相互作用在各种生命活动中起着至关重要的作用。复杂的蛋白质相互作用网络中包含着许多具有研究价值的信息,亟待有效的方法对其进行深入分析与挖掘。结构域作为蛋白质中重要的空间结构层次,提供了不可或缺的重要生物信息。本文提出了一种基于智能优化思想的蛋白质复合物识别算法,并且结合蛋白质结构域相互作用网络对疾病基因进行了预测。针对蛋白质相互作用网络(PPI)拓扑结构的局限性与偏好性,本文结合结构域和拓扑结构信息对PPI网络进行了重新构建。通过与基于拓扑结构的PPI网络和结合GO注释构建的PPI网络进行比较以验证添加结构域信息后的混合结构的PPI网络有效性。基于群智能优化中的头脑风暴策略,提出了一种蛋白质复合物识别算法——IPC-BSS(Identifying Protein Complexes based on Brain Storming Strategy)。IPC-BSS算法模仿人类头脑风暴的讨论过程,设计了使蛋白质节点可以在不同蛋白质复合物之间迁移,以及相互之间联系紧密的蛋白质复合物可以进行融合的两种更新策略,以得到更优的蛋白质复合物。该算法有效克服了在早期被错误划分的蛋白质节点难以纠正的缺陷。实验结果表明,与其它经典蛋白质复合物识别算法相比,IPC-BSS算法有较好的F-measure值,能有效识别具有生物学意义的蛋白质复合物,并能完全识别一些规模较大的蛋白质复合物。蛋白质结构域之间会存在一定地联系,形成结构域相互作用网络,它从空间结构层次上解释了蛋白质之间的相互作用,本文将结构域相互网络作为蛋白质相互作用网络与疾病相似性网络的桥梁,融合多层异构网络的信息,提出了非平衡三随机游走算法——UThrRW(Unbalanced Three Random Walk)。UThrRW算法不仅挖掘了网络内的信息,同时也利用了网络之间隐藏的生物信息,结构域相互作用网络会增强蛋白质相互作用与疾病相似性网络间的联系,从而提高算法的预测效果。实验结果表明,UThrRW算法预测疾病基因的效果优于经典的RWR算法、BiRW_b1算法和UBiRW算法。
其他文献
万有引力常数G是最早被认识和测量的物理基本常数之一,但迄今为止,它的测量精度却是所有基本常数中最差的。目前国际上不同实验小组测量的G值在误差范围内并不吻合,这可能源
由于当今社会对化石能源的过度依赖和利用,所引起的各种环境问题和能源冲突愈加严重。氢能被视为可以取代化石燃料的一种可持续的清洁能源收到了广泛关注。在电解水的过程中,电催化剂起着至关重要的作用,因为其决定了电解过程中的起始点位和电流密度。虽然Pt系贵金属具有非常优秀的电催化活性,但其储量低和成本高使得其无法广泛应用于工业生产中。过渡金属磷化物是使磷原子进入过渡金属的晶格间从而形成的间隙化合物,由于其导
铜绿假单胞菌是导致呼吸机相关性肺炎(Ventilator-associated pneumonia,VAP)的常见病原菌,该类感染是增加重症监护病房(intensive care unit,ICU)死亡率的独立危险因素。目
本文基于压电陶瓷振子激励装置,在平板湍流边界层中施加不同频率的周期性扰动。通过使用单丝微型边界层探针对无控制和施加控制条件下的湍流边界层流场进行对比测量,得到压电振子下游2mm处不同法向位置流向速度信号的时间序列,并对减阻工况下的流场多尺度展开研究。通过壁面摩擦阻力系数计算了减阻率,并对比不同工况下的平均速度剖面,在相同的自由来流下,当激励电压一定时,存在着最佳的激励频率能够产生最佳的减阻效果;当
本研究基于图书馆服务质量评价模型Insync Surveys,吸收借鉴国内学者对Insync Surveys的本土化研究,同时结合公共图书馆的基本性、便利性、均等性和公益性四个特征,对Insync Surveys评价工具的5个评价维度以及5大维度下的28个指标进行整合、删减以及补充,构建了具有5个维度和25个指标的公共图书馆服务质量评价模型。利用该模型的关注度/满意度测评工具,以大连开发区图书馆为
上世纪二十年代,数学家Rolf Nevanlinna引进了亚纯函数特征函数的概念并创建了著名的Nevanlinna理论,该理论推动了亚纯函数值分布论的蓬勃发展Nevan-linna理论在自身不断完善
伪随机序列在编码、密码、码分多址(CDMA)通信系统、雷达、声纳等领域中都有广泛的应用.因此设计具有良好随机性质(如高线性复杂度、低相关性等)的序列是一个很有意义的研究
分数阶微积分理论是在整数阶微积分理论基础上推广发展而来,从提出至今已有三百多年的历史。尤其是近几十年来得到了众多学者的研究,许多重要的成果在物理学、工程学、机械、
研究代数结构的一个很重要的手段是通过它上面的线性变换来刻画其内部元素之间的关系.这些线性变换常见的有自同构和导子.近年来,交换映射也是研究结合代数及李代数的一个很
伪随机序列在测距系统、扩频通信系统、码分多址通信系统、全球定位系统、软件测试和流密码等众多领域中被广泛应用.对一个周期序列,把生成该序列的最短的线性移位寄存器(LFS