关键蛋白质预测算法的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:jzsoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关键蛋白质对于生命的维持至关重要,其缺失会使生物体致病甚至死亡。识别关键蛋白质有助于对细胞功能和生物学机制的研究和探索。近年来,大量基于蛋白质相互作用网络(PPI网络)识别关键蛋白质的算法被提出,传统PPI网络基于生物实验测得的蛋白质相互作用数据(PPI数据)搭建,但这种PPI数据中有很多假阳性问题,如何有效过滤假阳性数据有待深入研究。PPI网络中,一个蛋白质重要程度并不仅仅取决于他的局部邻居的相关特征,我们应该纵观整个PPI网络来描述其中的每个蛋白质。针对以上问题本文提出两个关键蛋白质识别算法,研究内容以及创新点如下:(1)提出基于同一时间和空间活跃的蛋白质相互作用网络识别关键蛋白质算法TSWTSW融合生物数据构建同一时间同一空间活跃的PPI网络,基于改进的边聚集系数根据PPI网络的拓扑属性进一步衡量两个蛋白质的亲疏程度,为蛋白质相互作用边的权重赋值。TSW通过PPI网络固有的生物属性构建更为可靠的PPI网络,并融合PPI网络的拓扑属性构建最终的加权PPI网络。实验结果显示,与传统算法相比,TSW识别关键蛋白质精度更高。TSW的创新点在于,第一,基于基因表达数据和亚细胞定位数据构建同一时间和空间活跃的PPI网络,在描述蛋白质本身生物属性的同时,有效过滤假阳性数据。第二,提出改进的ECC,即WNECC,WNECC不仅描述一阶公共邻居的中心拓扑性质,还描述了二阶公共邻居的中心拓扑性质。(2)提出基于重启机制的LeaderRank在加权蛋白质相互作用网络中识别关键蛋白质算法RWLRRWLR首先利用GO注释和蛋白质复合物两种生物信息构建加权PPI矩阵,并根据TSW算法给PPI网络中所有蛋白质设置初始得分,最后基于重启机制的LeaderRank在加权PPI矩阵和蛋白质初始得分向量上不断迭代,当PPI网络中所有蛋白质得分收敛时,算法结束,蛋白质得分向量的最终结果即为所有蛋白质最终得分。RWLR为每个蛋白质提供了相对于整个PPI网络的全局描述,一定程度上解决了TSW算法的局限性。实验证明,与TSW相比,RWLR识别精度更高。RWLR的创新点在于,第一,改进LeaderRank,加入重启机制,将TSW算法中所有蛋白质的最终得分作为初始得分向量,令算法以一定的概率回到初始得分向量。第二,利用GO注释和蛋白质复合物两种生物数据构建加权PPI矩阵,融入改进LeaderRank算法,在加权PPI矩阵和蛋白质初始得分向量上不断迭代,使得RWLR为每个蛋白质提供相对于整个PPI网络的全局描述。与传统基于拓扑结构识别关键蛋白质算法相比,现有识别算法虽然融入很多生物属性,但仍有提升空间。目前针对生物属性的量化描述不能很好地表达生物信息,因此,未来的研究考虑结合深度学习,自动学习生物特性,以弥补现有算法的缺陷。
其他文献
我国作为一个社会主义国家,政府的影响遍及经济生产的很多方面,同时政府掌握了大量的经济资源。政治关联通常是指企业的高管通过曾经或现在在政府任职,或担任人大与政协委员而与政府建立的一种联系。近年来,我国上市公司高管高薪的现象十分普遍,高管薪酬作为对企业家才能的一种定价与激励措施,与诸多因素有关,包括公司的经营情况与公司治理水平。而上市公司高管具有政治关联也是一种较为普遍的现象,许多高管除了是公司经营者
大肠杆菌O157:H7因具有低感染剂量(10或以上细胞)和高致病性的特点成为近十几年来国内外关注的食源性病原菌之一。土壤中的大肠杆菌O157:H7可以迁移到其它环境介质或载体的表面和内部,因此了解大肠杆菌O157:H7在土壤中的存活行为及其影响因素将有助于减少此类病原菌引起的环境生物污染。为了因地制宜,本实验共计采集了24份土壤样品,根据美国农业部分类标准可分为粉壤土、壤土、砂壤土、壤砂土和砂土。
随着无线电技术的迅猛发展,定位服务越来越受到人们的欢迎。定位主要分为室外定位和室内定位两种。室内是人们生活时间最长的场所,研究室内定位有非常广泛的应用前景。但室内
医药制造行业关系国民健康和社会的稳定发展,我国具有世界上最大的医药市场,对医药制造设备有着庞大的需求。为了满足无菌化制药生产,制药上料机器人在医药自动化生产环节中起着重要作用。传统的制药上料移动机器人智能程度较低,轨道式或者巡线式的导航方式和基于WIFI、UWB的室内定位方式,均需要人为事先布置移动场景,需要大量的成本并且系统的场景适应性较低。针对智能移动机器人如何在没有先验信息的室内环境下自主移
压电陶瓷因其优异的铁电和压电性,被广泛应用在传感器、换能器、变压器和医学成像等领域,然而传统的Pb(Zr,Ti)O3(简称PZT)陶瓷含有大量的铅,污染环境且对人类健康有害,因此研究无
在自然界中,许多系统状态的变化不仅与当前状态相关,而且也与过去某个时刻或某个时间段相关,对于这类系统方程,我们一般建立时滞微分方程模型较为合适。另一方面,多进化过程的特征是它们在某些时刻经历状态的突然变化,这些过程受短期扰动,其持续时间与过程的持续时间相比可以忽略不计。相应地,容易假定这些扰动是瞬时地,也就是说,是以脉冲地形式出现地。这时,系统将不是连续的,而是半连续的,此时我们建立脉冲微分方程来
如何缓解由所有权和经营权的两权分离引起的委托代理问题是现代公司治理领域的重要课题。现有研究对代理问题的治理主要从激励和约束两个角度展开,前者主要通过实施管理层激励如设计股票期权、绩效奖励等提高股东和代理人之间利益的一致程度以降低代理人的自利倾向;后者则通过完善公司治理结构、健全内部控制等方法降低信息不对称程度。在金融经济学研究领域中,越来越多的学者关注到社会关系对经济主体行为决策产生的影响,为公司
中国股票市场历经20余年的发展,逐步演变为能够推动经济快速发展的催化剂,但由于市场法律制度的不成熟和上市公司治理体系的不完善,导致投资者的价值观念发生扭曲,信息不对称问题和代理冲突凸显,股票市场沦为政策和圈钱的工具,分红乱象诸多,引发了市场参与者与众多学者的分析与讨论。现金股利政策是资本市场研究和公司金融领域一直关注的热门课题,中外学者将其他经济理论加以融合,衍生出丰富的股利政策理论和假说。近年来
无线传感器网络应用十分广泛,极大地改变了人类的生活方式,该技术有非常好的发展前景。目前,无线传感器网络中关于择优路径的路由算法主要是基于动态传感器网络的,研究主要集
在无线电的发展进程中,各种电子产品的广泛使用,使得电磁环境日益复杂,所需的无线电往往是混有大量噪声的混合信号,一些有用信号甚至淹没在噪声中,导致人们难以获得并利用它