使用序列和网络信息预测辅酶A相关蛋白的集成算法

来源 :华中农业大学 | 被引量 : 0次 | 上传用户:mingxue27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
辅酶A(Coenzyme A,Co A)在多种细胞功能和代谢通路中发挥着至关重要的作用,准确识别Co A相关蛋白(Coenzyme A-associated proteins,CAP)有利于深入理解酰基转移、羧酸代谢、三羧酸循环等重要生物过程。利用实验方法鉴定这些重要蛋白耗时费力且价格昂贵,而开发计算方法则有望弥补现有实验技术的不足。虽然已有少数计算研究从不同角度对CAP进行了分析,但是鲜有研究对这些蛋白从序列、进化、结构以及网络等层面进行过系统的特征化并尝试综合这些信息来开发理论预测模型,因此本研究将率先在这方面进行探索。本研究提出了一种基于序列和网络信息来预测CAP的集成算法。首先,该算法联合机器学习方法和模板方法开发了用于识别Co A结合残基的预测模型,并且利用预测的结合残基分布特征进一步预测相关蛋白。实验结果表明相较于其他蛋白,CAP更倾向于与Co A或其衍生物发生物理绑定。其次,在序列和网络层面设计了其他六类特征并构建了相应的子分类器,这些特征包括词嵌入向量、远距同源物数量、进化保守性、氨基酸组成、预测的结构特征和网络拓扑特征。通过比对分析,发现CAP具有更多的远距同源物且更古老的蛋白质年龄,同时拥有更有序的且疏水的分子构象,并在蛋白质相互作用网络中稠密聚集。然后,对上述七个子分类器分别在人类、小鼠和拟南芥的训练集上进行了评测,发现所有分类器均可以用于预测CAP,相应的曲线下面积均大于0.7。为了联合不同来源的信息,进一步以子分类器的输出概率为特征构建了两层堆叠的集成算法,该模型在三个物种的训练集上获得的曲线下面积分别为0.990,0.985和0.981,在测试集上的曲线下面积分别为0.965,0.969和0.968。这些结果表明联合多元化的信息有利于更准确地识别CAP。最后,把已建立的模型应用于Uni Prot数据库中已审核过的上述三物种的所有蛋白,选取具有较高预测分值的165个人类蛋白、206个小鼠蛋白和231个拟南芥蛋白进行基因功能和通路富集分析,发现这些蛋白主要富集到氧化还原及多种合成与代谢过程,位于线粒体和叶绿体等细胞组分并参与多种氨基酸代谢和三羧酸循环通路。这些观察与CAP的已知功能一致,进一步肯定了模型的有效性,同时为Co A与相关蛋白间的相互作用提供了新的线索。
其他文献
C-H键官能团化反应为构建有机小分子提供了环境友好和高原子经济的重要途径。苯酚类衍生物是许多药物、农用化学品和聚合物中常见的重要组成部分,同时也是非常重要的有机合成
随着数字城市和数字地球概念的提出,三维数据的处理分析成为摄影测量、遥感、机器人以及计算机视觉等领域的研究热点。作为场景建模、自主导航以及目标检测等众多应用程序的基础,三维场景点云的可视化及语义标注技术越来越重要。本文以Velodyne VLP-16激光雷达传感器获取的校园场景点云数据为研究对象,研究了基于条件随机场的校园场景语义标注方法,在场景点云的预处理、点云分割以及点云语义标注三个方面展开了研
氮氧化物作为我国大气环境的主要污染气体之一,不仅仅造成酸雨,光化学污染等环境问题,还是形成PM2.5的主要前驱体。随着国家下达一系列文件、展开一系列措施,氮氧化物的治理刻不容缓。目前,虽然氨选择性催化还原法(NH3-SCR)在世界上固定源NOx的去除得到广泛应用,但是该技术的主要核心SCR催化剂的适用温度在280-420℃,该温度区间一般适用于电厂行业。一些非电厂行业(冶金窑炉,水泥,钢铁烧结炉)
随着工业的迅速发展,水体环境不断恶化。甲苯是一种芳香族有机化合物,虽然微溶于水,但是即使少量也会对人体造成伤害。因此,为确保供水安全,从水中去除这些有机污染物十分关键,而吸附法是目前对废水的处理方法中较常用的方法。还原氧化石墨烯比表面积较大,表面呈疏水性,因此对芳香族有机化合物有较强的的吸附能力,但是存在吸附后不易回收的问题,所以本文选择将氧化石墨烯与二氧化硅溶胶混合后快速凝胶,然后进行高温还原,
近年来研究表明,稀土-钛氧簇合物不仅具有丰富多样的结构,还具有潜在的发光性质。由于稀土-钛氧簇合物研究时间较短,体系尚不完善,因此对稀土-钛氧簇合物结构及性质的研究具
执行依据是由特定机关作出的生效的法律文书,是执行机关执行案件的根据,上面记载了权利义务的主体、内容等事项,是实现当事人权利的前提条件。执行依据须明确记载当事人之间的给付关系,以及享有权利和承担义务的具体内容、范围、标的等事项。但是,很多时候执行依据会出现表意模糊等问题,导致执行难的情况出现,从而引发执行效率低下,当事人权利不能得到实现,司法资源浪费等现象的发生。本文针对执行依据不明确导致执行难的情
Skew-gentle代数作为一种特殊的clannish代数,在带puncture的标记曲面上的丛范畴研究中有重要应用.在带有puncture的标记曲面的情形下,一个三角剖分可以给出一个skew-gentle
目的:探讨Her-2不同状态下乳腺癌基因拷贝数变异(Copy number variations,CNV)的分布,筛选影响Her-2阳性乳腺癌的关键基因,为Her-2阳性乳腺癌治疗研究奠定科学依据。方法:选取2018年1月1日—2018年12月31日我院乳腺癌组织和癌旁组织标本30例,采用全外显子高通量测序法检测DNA的CNV情况,并对Her-2不同状态乳腺癌的CNV进行分析。利用GO数据库、KE
近年来,世界环境问题日益严峻,为了世界环境和资源的可持续发展,各国、各行业都开始注重新能源方面的研究,使用电能代替化石能源已成为汽车行业和工程机械行业的重点研究方向
虚拟现实技术作为一种交叉型技术,它融合了计算机图形学、多媒体、人机交互以及网络等多种技术,广泛应用于多种领域。近年来虚拟现实技术发展迅速,同时也为医疗行业开辟了新