整合序列和进化信息预测细菌Ⅳ型效应蛋白和噬菌体病毒蛋白

来源 :上海海洋大学 | 被引量 : 0次 | 上传用户:grant121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物体的必要组成成分,参与了细胞生命活动中的每一个进程,它的种类繁多且功能各异,准确预测蛋白质的功能对于疾病预防和药物开发等领域具有重要的意义。随着测序技术的发展,蛋白质序列数据呈指数级的增长。然而传统的实验方法费时费力,已经不能够满足如今大量蛋白质数据注释的需求。因此迫切需要使用计算的方法来快速、准确的预测蛋白质的功能。经过实验证明,PSI-BLAST profiles可以为各种蛋白质分类任务提供重要的和具有辨识性的进化信息。然而,在之前的工作中,从PSI-BLAST profiles衍生出来的进化特征并没有得到充分的探索和使用。本文我们通过使用进化特征来准确识别细菌IV型效应蛋白和噬菌体病毒蛋白,主要内容如下:(1)许多革兰氏阴性菌利用IV型分泌系统将效应分子输送到多种靶细胞。这些底物蛋白质,被称为IV型分泌效应物(type IV secreted effectors,T4SE),在感染过程中操纵宿主细胞过程,常导致宿主严重疾病甚至死亡。鉴于T4SEs在了解宿主-病原体相互作用方面具有重要作用,如何准确的识别T4SEs已成为生物信息学中一个非常活跃的研究课题。在本研究中,我们开发了一种名为iT4SE-EP的精确预测模型,该模型通过从位置特异性评分矩阵和位置特异性频率矩阵中提取进化特征来识别T4SEs。首先,设计了四种编码策略,将非等长的蛋白质序列转化为相同维度的特征向量。然后,利用基于随机森林算法的特征选择技术,在不损失大量信息的前提下减少冗余或无关特征;最后,将最优特征子集输入支持向量机分类器进行T4SEs的预测。独立测试结果表明,iT4SE-EP方法优于现有的大多数方法。(2)噬菌体病毒粒子蛋白(phage virion protein,PVP)是噬菌体结构蛋白的一种,是感染性病毒粒子的重要物质,具有多种生物功能。PVPs的准确鉴定对于了解噬菌体与宿主菌的相互作用,开发新的抗菌药物或抗生素具有重要意义。然而,传统的实验方法往往是费时费力的。因此,开发高效、准确地识别PVPs的计算方法是一个有待解决的问题。在本研究中,我们提出了一个多分类器投票模型,称为iPVP-MCV,用于提高PVPs的预测性能。首先,从位置特异性评分矩阵中提取三种类型的进化特征来代表PVPs和non-PVPs。然后,基于支持向量机算法结合各类特征训练一组基分类器。最后,结合这些基分类器的输出,采用多数投票策略构造出iPVP-MCV。实验结果表明,本文提出的iPVP-MCV模型在进行严格的独立数据集测试时优于现有方法,可以作为一个有用的工具来识别PVPs。通过对iT4SE-EP和iPVP-MCV在基准数据集上测试结果的对比分析,可以观察到我们提出的两个方法都表现较为出色,相比于现有相同研究领域中的一些方法在结果上均有提升。这证明了iT4SE-EP和iPVP-MCV在其相关领域中具有很大的应用价值。
其他文献
在生物学研究领域,高通量测序技术催生了海量的生物学数据。从这些生物学数据出发,利用合适的生物信息学方法发掘与疾病发生机制相关的生物通路,研究疾病与生物通路间的关系,对疾病的诊断和治疗技术的发展具有重要的意义。从高通量的海量数据中获得对疾病深层次的认识,发现疾病的复杂机制依然是研究人员面临的一个挑战。虽然在过去的十几年,相关研究人员已经开发出一些基因富集分析方法来发现与疾病相关的生物通路。然而这些方
学位
车辆分群调度问题是计算机科学和运筹学中一类重要的组合优化问题,其在现实生活中具有广泛应用,如磁盘碎片整理、程序重构、细胞检测、集成电路测试、考试时间表安排等等。因此,对其进行研究具有重要的理论与实际价值。本文主要研究几个特殊网络上单台车辆分群调度问题。给定一个网络图,若干个待服务的客户分布在该网络上,并且这些客户被划分为若干个子集,每个子集称为一个群。给定一台车辆,其需要服务所有客户,且每个群内的
学位
随着互联网和社会经济的迅速发展,人们面临的法律问题越来越多样化、复杂化,因此法律咨询业务的推进对社会的发展而言,有着非常重要的价值。然而,律师相关的咨询业务在现实开展过程中还是面临各种各样的窘境,比如:发展速度慢,律师咨询业务创收较低,聘请率低下,律师业务水平不足等诸多问题。因此,借助大数据和深度学习的方法,建立自动化民事纠纷问答模型具有较高的学术价值与应用价值。民事纠纷问答面临的难点为专业领域性
学位
近年来,随着人们对海参、海胆、贝类等海珍品需求量的增加,海产养殖业取得蓬勃的发展。在海洋牧场建设领域,主要利用拉网或人工抓取的方式对水下环境中的海珍品进行捕捞,但上述方式存在劳动强度高、工作效率低及安全风险高等问题,因此研发一种能够自动识别、定位及抓取海珍品的水下机器人,对降低劳动强度、提高捕捞效率以及促进海洋牧场的智能化发展具有重大的意义。水下目标的精确检测是水下机器人实现自动化检测和抓取作业的
学位
水产养殖业在我国农业经济社会发展中占有重要地位,水产养殖规模和产量也在逐年扩大。在目前的水产品交易中,数据多采用中心化的存储方式。在这种模式下,数据容易被篡改、共享能力低且追溯困难。当出现水产品质量安全问题时,无法根据订单信息进行水产品养殖信息的有效追溯。除此之外,交易数据对于养殖厂的经济效益和整个水产品供应链的良性运转也有着重要作用。区块链技术具有去中心化、数据公开透明、不可篡改和信息可追溯的特
学位
近年来,随着我国水产养殖业的飞速发展,精细智能以及预防化养殖方式已逐渐成为未来的养殖趋势。作为水产养殖品种之一,在水产养殖过程中出现的例如温度急剧变化、溶氧异常或人为干预等多维因素让虾苗处于应激状态,影响虾苗存活率。及时发现虾苗处于应激状态可以大幅减少养殖损失,提高虾养殖产量和效率。一般急性应激会使虾苗产生异常生理和行为变化,因此虾的行为对养殖者而言是一种有价值的参考信息。本文以南美白对虾为研究对
学位
紧密子图查询作为图查询的研究热点之一,在很多领域都有着重要的应用。现有的研究中已有许多紧密子图查询方法,如基于模块度优化的算法、谱方法、非负矩阵分解等。对于紧密子图的定义也有多种,常见的有k架(k-truss)、k团(k-clique)、k核(k-core)等。其中k核的定义要求图中每个节点至少有k个邻接节点,即每个节点的度至少为k。根据该定义,k核可以在线性时间复杂度内计算得到,具有较好的应用基
学位
饲料中添加抗生素是防治腹泻的常用方法,然而长期以来由于大多数养殖场不合理使用抗生素导致耐药菌株产生、畜禽产品品质下降、人类食品安全遭受威胁等问题出现。我国农业农村部发布公告,自2020年1月1日起,禁用所有除中药外的促生长类饲料添加剂。因此,寻找能够替代抗生素的药物迫在眉睫。中草药来源广泛、种类丰富,具有抗病毒、抗细菌、提高免疫力等多种功效,并且毒性低、残留少、不易产生耐药性。综合"禁抗"的时代背
期刊
随着图像处理传感器与采集系统的快速发展,以及无人机在社会上越来越普及,人们获取无人机遥感图像的方式也越来越便捷。无人机遥感作为补充卫星遥感和有人机航空遥感不足的航空遥感手段,不仅可以获得正射遥感图像还可以获得倾斜摄影遥感图像。在很多领域中人们对遥感图像中的地物情况在语义上的精准分割都有着很大的需求,如城市建设、精准农业、灾情监测以及环境监测等各个领域。由于遥感图像中目标尺度多,网络高层次特征中小目
学位
受到生物特点和复杂环境等诸多因素的影响,长久以来浅海增养殖难以做到精准监测、检测和利用,我国浅海增养殖虽然经过长久发展,但养殖信息化和智能化程度低、大数据挖掘与分析技术薄弱,由于历史和现实原因,养殖数据具有资源途径多样、结构繁杂、质量参差不齐、应用范畴宽广、数据总体质量偏低的特点,现有浅海增养殖多依赖人工,这也造成了数据资源无法做到有效利用。近年来随着养殖大数据技术和生态学养殖的多元化发展,通过学
学位