基于蛋白质关系网络的复合物抽取研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:dengwj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
开创系统生物学以来,信息技术成为生物学研究不可缺少的重要手段。计算机领域的研究者利用数据挖掘、机器学习等方法从不同角度诠释生物学中的难题。其中关于生物网络中重要的蛋白质关系网络的研究逐渐成为近年来研究的热点,计算机领域研究者通过计算方法来探寻蛋白质功能、发现蛋白质复合物及功能模块。本文通过分析蛋白质关系网络的可靠性对蛋白质复合物识别的影响,针对生物学家不同的需求情况,设计了基于蛋白质关系网络可靠性分析的蛋白质复合物识别算法,主要研究包括:本文首先对蛋白质关系网络的可靠性进行分析,即利用基因共表达数据、蛋白质结构域等量化蛋白质关系的可信度,并通过对比模糊贝叶斯分类模型与普通贝叶斯模型在分类蛋白质复合物时的差异,揭示蛋白质关系网络的噪音对蛋白质复合物识别的影响较大,为设计以下三种基于蛋白质关系网络可靠性分析的复合物识别方法提供依据。在已知蛋白质关系网络并且网络不可变的情况下,本文提出基于基因本体的语义相似度计算方法来对网络边加权,并结合加权网络设计了蛋白质复合物的识别方法。结果表明,利用基因本体的加权方式,减轻了网络中的假阳性信息的影响,与现有多个性能领先的复合物识别方法相比,该方法取得了最高的F值。在已知蛋白质关系网络并且网络可变的情况下,本文融合丰富生物信息资源为特征利用机器学习方法重新构建网络用于复合物识别。结果表明,重新构建的关系网络较之现有蛋白质关系网络含有可信蛋白质关系比例更高,现有蛋白质复合物识别方法在重新构建的网络上性能均有提高,尤其显著体现在准确率和F值上。在未知蛋白质关系网络仅已知有限的少量蛋白质关系情况下,本文提出了多层网络模式转换方法构建新关系网络用于复合物识别。实验结果表明,本文方法识别复合物的性能高于现有方法,尤其体现在F值上,此外,新建网络较现有网络含有更高比例的在生物学意义上相关的关系,其他蛋白质复合物识别方法在新建网络上性能同样得到提高。综上所述,本文针对蛋白质关系网络的可靠性问题,在不同条件下,有效的解决了网络中关系不可靠性对蛋白质复合物识别的影响,其中一些预测的新复合物已经过生物意义上统计评价,很可能对生物实验有所启发。此外,本文提出的蛋白质关系网络构建方法,对其他复杂网络中边的预测也具有一定的借鉴意义,将在未来工作中继续探讨。
其他文献
日本显微镜制造商“Scafar”推出随身看“视像眼镜”,透过眼镜上连接的一个小型荧光幕,观众可以随时随地观看电影。“视像眼镜”将于今年6月上市,用户可以把一个0.61cm、包括液晶
核回归是一种非参数估计方法,它从观测数据出发估计图像,只需要较少的图像或噪声分布,因此能够广泛地适用于各种类型的图像及噪声处理,并且在保证去噪效果的同时保留图像细节
随着光学成像与图像处理的快速发展,基于X射线图像的目标自动检测越来越广泛地应用于工业、医疗以及军事安全等领域。在X射线图像成像过程中,有些目标因为较为弱小或者对X射
中草药资源丰富,毒副作用小,在动物体内无残留,可为人们创造绿色安全食品。文章主要介绍几种单体或复方中草药饲料添加剂对禽肉品质的调控作用。
随着医学影像技术和计算机技术的融合发展,虚拟手术在医学领域的应用逐步深入。它为医生提供了一个集合术前计划制定、术中操作模拟、术后结果预测以及手术训练等各种功能的
现有的各种仿形磨床和相关机床多采用旋转工作台和自动控制原理,工件加工难度大,精度高,仿形磨床工件夹持机构是影响加工精度和可靠性的重要环节。对于各种精密仿形磨床,加工过程
现象上观察到的道教音乐形态,其风格之形成、变化,很大程度上是因其关系着的发生环境(从一般概念上而言的教派体系、信仰系统,到道场仪式活动中的相关细节)所决定和支配的。
文章指出要想在散打运动中取得成绩,必须在观察与分析对手战术及技术的基础上,制定适合于自己机动灵活的战术训练原则以及科学系统的战术训练方法,并在实战中合理地加以运用,从而
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
基于对新疆地区能源与经济发展情况的分析以及煤化工行业二氧化碳排放估算,浅要分析了新疆地区煤基能源化工基地碳捕集、利用与封存技术的发展路线。