基于监督学习的人类蛋白质网络复合物识别

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:huntergy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质复合物是功能相似的蛋白质分子通过聚合作用形成的大分子结构,并以复合物的形式在生物体中发挥作用,在理解生物体的生命机制和原理等方面具有重大意义。随着人类基因组学研究和高通量技术的发展,海量的蛋白质关系数据也随之产生。这些蛋白质关系构成多样的蛋白质关系网络,如酵母菌蛋白质关系网络、人类蛋白质关系网络、病菌蛋白质关系网络等。这些关系网络为复合物识别的研究提供了很好的数据支持,但同时多数据中存在的不可靠关系也给复合物识别带来了较大的挑战。本文首先介绍了蛋白质复合物识别算法的研究背景与意义、国内外相关学者的研究现状等,在此基础上对蛋白质复合物识别任务中存在的问题进行了总结:如何在人类蛋白质网络上进行有效的复合物识别,并揭示蛋白质复合物与疾病间所存在的关系;如何为不同的蛋白质关系网络选择合适的复合物识别算法来获得较高的性能;如何融合更多的特征到复合物识别任务中,以进一步提升算法的性能。这些问题的存在限制了复合物识别算法的发展。接着,为了在人类蛋白质关系网络上进行有效的复合物识别,本文改进了已有的基于监督学习的复合物识别算法。改进的算法充分利用了网络的拓扑结构性,并融合了基因本体的生物特性,从而提升复合物识别算法的性能。此外,为了更好地揭示蛋白质复合物与疾病间的关系,本文利用蛋白质关系抽取系统从生物文献中抽取与特定疾病相关的疾病蛋白质关系,并融合到原始网络中,以提高疾病复合物识别的实验效果。同时通过分析对应的疾病复合物,来加深人们对相应疾病的理解。随后,为了快速对不同蛋白质网络的复合物识别选择合适的算法,本文针对酵母菌蛋白质网络和人类蛋白质关系网络展开研究,并探索了已有的复合物算法在不同网络上的适应程度。此外,为了揭示不同特征在不同网络上的作用强度,本文将已有算法的回归模型和随机森林模型进行对比,从而为进行复合物识别算法的研究提供有益借鉴。最后,已有的复合物识别算法全都是基于人工的特征。为了衡量自动学习特征在复合物识别任务中的作用,本文将基于点向量的学习方法融合到已有的复合物识别算法中。通过多特征的融合,使得已有的复合物识别算法更加有效。
其他文献
目的:核糖体蛋白S6激酶(RPS6KA1)是一个高度保守的Ser/Thr激酶,别名RSK1,属于RSK家族成员,近年来有较多研究报道RSK家族与多种肿瘤的发生和发展有关,但其在肺癌中所发挥的作用研究较少。本研究的主要目的是探讨RPS6KA1在肺腺癌中的表达水平和预后价值。方法:在本研究前期,首先对本院21例非小细胞肺癌(non-Small Cell Lung Cancer,NSCLC)患者组织标本
随着京津冀协同发展,天津滨海新区成为华北地区最主要的石化工业基地。在石油开发利用过程当中,由于“跑冒滴漏”使得石油入渗到地下含水层中,对地下水环境造成污染。本文以
光伏发电技术是未来最重要的能源技术之一,染料敏化太阳能电池(DSSC)是新一代光伏电池的重要成员,低消耗、低成本和高理论效率的优势使其具有巨大的应用前景,开发稳定、高效的DSSC对解决能源危机和环境污染问题具有重大意义。DSSC光阳极TiO_2多孔层厚度对其性能有重要影响,本文制备了不同厚度的光阳极TiO_2薄膜,组装电池后进行光电性能测试。对于液态电池,TiO_2膜厚为13.2μm时器件性能最好
海量数据分析技术是当今时代热门研究方向,同时也是未来几年的研究重点,对于该方向的深入研究有着很好的前景。在科学研究领域,复杂性分析查询导致了网络和IO的大量消耗。这
随着支持实时通信的移动互联网应用蓬勃发展,电信运营商有被彻底“管道化”的威胁。尽管电信运营商拥有丰富的网络资源以及海量的用户资源,但其能力的封闭性却导致其无法与移
当今社会发展愈来愈快,世界经济高速发展的同时能源的消耗速度也逐渐增加,石化能源的过度使用导致我们赖以生存的地球环境受到严重污染,所以积极寻找环保洁净的能源成为热论和研究的重要话题,生物柴油作为环保燃料受到世界各国学者的广泛关注。本文采用溶剂热法合成UiO-66及其衍生物,合成中添加不同的调节剂调节锆基MOFs结构。采用XRD、SEM和FT-IR等方法进行表征,研究不同的调节剂和添加量对锆基MOFs
互联网和移动互联网的快速发展促使全球数据量爆炸式地增长,Web已经成为各领域最具潜力和价值的巨大信息来源。Web网页中除了用户关注的正文等相关信息,还包含着导航、广告和
随着信息技术和互联网技术的飞速发展,使用互联网的人数不断增加,互联网产生的信息量呈指数级别迅速增长,人们已经从信息匮乏的时代进入了“信息爆炸”和“信息过载”的时代
目的:通过锥形束CT分析成人女性骨性Ⅰ类不同垂直骨面型下颌骨及颏部形态特点,以及分析下颌骨及颏部形态特点与不同垂直骨面型的相关性,为不同垂直骨面型患者正畸临床诊断及矫治目标提供参考。方法:选取骨性Ⅰ类患者86例纳入研究,根据SN-GoGn角(前颅底平面-下颌平面角)划分低角组:SN-GoGn≤29°(30 例)、均角组:29<SN-GoGn≤39°(30 例)、高角组:SN-GoGn>
本文选择了15种常见的插值方案,以台风DOTSTAR数据中的投落送观测资料为试验对象,对插值方案进行了计算误差的比较分析试验。结果表明:光滑不等距插值(enspl)在对速度u、速度v