基于GSVM的蛋白质磷酸化功能聚类

来源 :广西大学 | 被引量 : 0次 | 上传用户:lgfyhx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质磷酸化在细胞生长、分化、凋亡整个过程中扮演至关重要的角色。磷酸化蛋白质的特定位点能起到开关该蛋白质某种功能的目的,从而实现在不同生物过程中该蛋白发挥不同作用的目的。这一过程是通过磷酸激酶催化来实现的。同时,磷酸激酶的催化作用也可以被抑制剂终止,以阻止磷酸激酶对蛋白质的磷酸化。研究表明,磷酸化异常是导致人类疾病的重要原因之一,通过抑制剂终止磷酸激酶的催化作用,将异常磷酸化功能阻断,可以实现疾病治疗。因此,磷酸激酶及其抑制剂的交互作用是当今病理学和生物信息学研究的热门问题之一。现有与磷酸激酶研究相关的算法主要集中于磷酸位点的预测,然而大多已预测的磷酸肽的磷酸激酶信息未知。而且现有算法在阈值选取及窗口长度划分问题上多采用定值,导致算法只能处理部分数据,而对另外部分数据失效。除此之外,磷酸激酶信息的缺失,对抑制剂的筛选影响很大。鉴于此,本文旨在设计有效算法确定催化蛋白质的磷酸激酶,以及能与磷酸激酶相互作用从而终止磷酸化过程的抑制剂。本文研究主要工作如下:(1)针对磷酸激酶信息缺失的问题,设计了基于贝叶斯的磷酸激酶预测算法。该算法结合信息熵及大津法筛选磷酸肽有效位点,在最佳窗口长度下,通过计算磷酸激酶信息缺失的磷酸肽序列贝叶斯条件概率,预测其最可能的磷酸激酶。(2)针对磷酸激酶抑制剂维度很高的问题,设计了基于GSVM的磷酸激酶抑制剂筛选算法。该算法通过粒度划分,准确筛选磷酸激酶-抑制剂特征,从而提高分类性能。同时,利用Platt Scaling计算样本权重,构造带权分类算法进一步提高分类性能。(3)针对磷酸激酶-抑制剂正样本较少,未标记样本很多的情况,本文对磷酸激酶抑制剂筛选算法采用了半监督学习算法(PU learning)建模。PU learning算法设计初衷就是处理正样本较少、未知样本很多的问题,因此能很好的预测磷酸激酶-抑制剂结合问题。同时,该研究把PU learning算法与GSVM相结合,构造多级分类器,提高了对未标记磷酸激酶-抑制剂交互作用分类的性能。实验结果表明,本文采用基于贝叶斯及大津法自适应阈值的磷酸激酶预测算法在特异性、敏感性及准确度上比已知磷酸激酶预测算法有很大提高。同时,本文设计的基于PU learning和GSVM的磷酸激酶-抑制剂预测算法性能突出,具有很强的泛化能力,提高了预测磷酸激酶-抑制剂交互作用的能力。
其他文献
Quidway NetEngine 5000E核心路由器(简称NE5000E)是华为公司推出的高端网络产品,主要应用在IP骨干网、IP城域网骨干层以及各种大型IP网络的核心位置。路由器多框集群的产品
作为数学的一个新的分支,图论起源于著名的哥尼斯堡七桥问题,它以图作为研究对象。近年来受计算机科学技术飞速发展地刺激,图论的发展极其迅速。其应用范围不断拓广,出现了越
随着计算机技术和网络技术的不断发展,网络的应用不断深入,网络安全问题也日趋严重,包括计算机病毒、特洛伊木马、拒绝服务攻击、恶意软件、黑客入侵等在内的安全问题频繁发
基于IP技术的各种应用的提出,特别是VOIP、FOIP技术的提出,使数据网络通信逐渐融入了传统的话音、传真业务领域。在无线通信领域。基于IEEE 802.16协议的WiMAX技术凭借其初期
运用自动化分割和三维重建技术来处理医学图像,辅助医生进行分析与诊断,避免了凭借医生的主观想象和临床经验的传统阅片方法带来的不足,能增加工作效率、提高诊断精确性、客
经济的发展以多种资源为基础,排样问题的工作主要是对材料进行优化利用,在涉及材料分割的行业有广泛的应用,如机械制造、皮革服装、建筑设计、交通运输、航空航天等领域。排
人脸识别技术最友好、自然、直接的生物特征识别手段,在社会公共安全、政府机关、视频监控、电子商务等领域都有着广泛的应用空间,人脸识别技术可分为人脸检测和识别两个基本
随着计算机技术的飞速发展,分布式异构系统逐渐成为解决复杂问题的有效工具。它的主要目标是通过网络互连实现全系统范围内的资源的共享,同时它还利用高效的资源管理和任务调
词汇语义相似度计算作为中文信息处理中的一个关键问题,国内外众多学者已对其开展了广泛而深入的研究,它是信息检索、信息抽取、文本分类、词义排歧和机器翻译等重点研究领域
下料问题存在于生产的各个领域,如剪切金属板材和带材、锯切木板、切割平板玻璃等。其中二维下料的应用较为广泛,而矩形下料是二维下料的基础。本文研究的是矩形二维板材下料