基于序列的线性互作用肽的预测算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:fclhp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
固有无序蛋白质在自然状态下局部或整体不具有稳定的空间结构,其中具有动态结构的氨基酸片段被称为固有无序片段。大部分固有无序片段能在伴侣蛋白的作用下被诱导折叠,从而获得稳定结构。过去数十年间,这类固有无序片段得到大量研究,由此出现了从不同角度描述此类片段的多个术语,包括分子识别特征,短线性基序和蛋白片段。2018年,致力于固有无序蛋白质研究工作的学者们整合了关于此类片段的各种数据资源,并提出了线性互作用肽这一概念以囊括之前的各种术语。现有的分子识别特征的计算方法可以预测线性互作用肽,但这些方法存在明显的问题:包括对线性互作用肽的预测精度相对较差,且预测效果受线性互作用肽的长度牵制。因此,我们设计了一个预测线性互作用肽的新方法CLIP(Consensus for LIP Identification)用于准确预测任意长度的线性互作用肽。首先,我们构建了两个子模型,COEV和PHYS。前者基于从多序列比对中提取共进化信息,后者基于线性互作用肽的理化特性。接下来,我们应用逻辑回归将COEV、PHYS和固有无序预测方法DISOPRED3集成后,得到了CLIP方法。5折交叉检验的结果表明:基于共进化信息的模型COEV是3个子模型中单独预测最准确的一个;与单个模型COEV组件相比,三个子模型的集成模型CLIP将AUC和MCC分别提高了24.4%和406%,这说明CLIP集成模型能为线性互作用肽提供更加准确的预测。在独立测试集TE440上,CLIP明显优于计算方法ANCHOR,Diso RDPbind,SPOT-MORF和Mo RFchibi SYSTEM;事实上,CLIP在AUC和MCC比这些方法至少分别提高了5.1%和68.2%。集成模型CLIP在线性互作用肽预测上精确性可归因于共进化信息的引入以及其3个子模型之间的互补性。最后,我们为集成模型CLIP搭建了在线网络服务平台(https://yanglab.nankai.edu.cn/CLIP),以方便感兴趣的研究工作者使用。
其他文献
新时期的办公室秘书,必须具备良好的公文写作能力,能够准确全面地转达上级的指令,从而推动各部门有序运转,保证单位健康发展。然而,在时代不断发展的背景下,公文写作面临着新的挑战,为了保证办公室工作质量,必须研究提升办公室秘书公文写作能力的策略。
期刊
求解线性差分方程是符号计算的一个基本问题,具有广泛的应用。线性差分方程符号解的构造方法及其应用已被Abramov,Petkovˇsek,van Hoeij等人广泛研究。此外,Karr考虑了差分域(F,σ)的扩张(F(t),σ),引入ΠΣ-域求解一阶线性差分方程的符号解,并用来寻找有限和的闭形式或证明这种形式的存在性,有效解决了一阶递推序列如调和数的求和问题。Bronstein将此算法推广到更一般的
学位
2023年公布的《党和国家机构改革方案》,对社会主义市场经济条件下与政府监管职能相关的机构进行了调整,尤其以金融监管最具典型性。本文基于监管型国家建设的维度,选择金融监管机构改革为研究对象,借鉴适应性监管理论分析视角,并将其与中国监管改革的独特情境因素相结合,从整合性、权威性、抗干扰性和事权集中层面对此次改革的历史背景和特征进行了归纳,并结合外部因素中的监管压力、市场结构,以及内部因素中的路径依赖
期刊
异质结构网络的相关问题在实际应用中广泛存在,不同于同质结构网络,异质网络往往包含不稳定的组件,因此如何配置网络结构,使异质网络具有稳定性,是当前研究的重要课题。本文以异质网络为研究对象,针对由弹性介质和粘弹性介质组成的线形和星形两种波网络,研究各部分组件配置使得系统具有适定性和指数稳定性。借助预解族方法证明了解的存在唯一性,该方法对于带有记忆的系统具有普适性。利用Lyapunov函数方法,通过构造
学位
本文主要研究分数阶非线性非局部方程——分数阶快速扩散方程、分数阶调和映射及其热流和分数阶Landau–Lifshitz–Gilbert方程,我们提出逼近其弱解的有限元格式,并证明这些格式相应的收敛性.对于欧式空间中多面体有界区域上的分数阶快速扩散方程,本文提出空间变量上的连续分段线性有限元Galerkin逼近和时间变量上的后向Euler离散格式,给出近似解的先验估计和收敛性分析,并进一步将结果推广
学位
<正>讲话类公文是指在政务场合所使用的,包括讲话稿、贺词、开闭幕词、欢迎词、祝酒辞等诸多文种在内的事务性文书的统称。尽管这些文种并未跻身《党政机关公文处理工作条例》所规定的法定公文之列,但上到国家领导人出席重要会议、重大活动,下到基层领导安排公务接待、推进工作,发表讲话、致辞已经成为必备环节,如习近平主席发表的新年贺词、前外交部长李肇星在新年招待会上的祝酒辞。然而,由于法定地位的缺失和实际运用的广
期刊
Snake模型或活动轮廓模型是用于边界检测和分割的经典方法,会使初始轮廓(2D)或初始表面(3D)朝着目标的边界进行变形。这样的模型是处理医学图像分割问题的理想选择,因为它们非常有效并且由于只需要跟踪显式曲线或曲面,需要较少的存储空间。然而,通过水平集方法求解的传统Snake模型存在数值不稳定性,并且通常难以应对拓扑变化。在本文中,我们提出了一种用于3D医学图像分割的可学习型Snake模型,其中初
学位
实际应用中的许多不确定性的问题都归结于通过相似性度量找到共同性以建立模型。衡量向量相似性的度量函数分为余弦距离、皮尔森距离等角度度量和欧氏距离、曼哈顿距离、切比雪夫距离等长度度量,衡量矩阵相似性是利用特征向量构成的可逆矩阵将对称矩阵分解为一个对角元素为特征值的对角矩阵。本文利用处理高阶数组的工具张量,将多维度大容量的数据构成张量,并提出了张量距离模型和张量分解聚类模型及其应用,主要工作为:1.张量
学位
偏微分方程在自然科学和工程技术科学中应用广泛,它的正问题是根据定解条件求解偏微分方程,从而得出过程或物体状态的数学描述;而反问题则是根据已知或测量的条件确定方程的未知条件。双曲型方程反问题在模式识别、大气测量、无损探伤、图像处理、特别是地球物理勘探等领域有着重要的应用。本文研究了黎曼流形上双曲型方程具有未知系数的反问题,对于具有初边值条件的双曲型方程,分别讨论了电势系数和阻尼系数未知的情况。对于具
学位
认罪认罚从宽制度的深入推进为相对不起诉的适用提供了更大的空间,但实践中,认罪认罚案件相对不起诉却存在整体偏低且适用不均衡的问题。总结北京市检察实践经验,可发现认罪认罚案件中相对不起诉适用率低的主要原因是缺乏明确、统一的适用标准。鉴于认罪认罚案件集中在危险驾驶罪、诈骗罪等7种常见罪名,应逐类研究这7类案件的相对不起诉适用标准。作出相对不起诉决定时,综合考量犯罪行为的社会危害性、犯罪嫌疑人的人身危险性
期刊