基于多序列特征的跨物种的蛋白质谷胱甘肽化位点的识别

来源 :东北师范大学 | 被引量 : 0次 | 上传用户:dadada123sasasa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谷胱甘肽化是一种可逆的翻译后修饰,对蛋白质的稳定性,氧化还原反应起着重要的作用。充分地理解谷胱甘肽化机制,识别谷胱甘肽化位点是至关重要的。相比于利用生物实验方法识别谷胱甘肽化位点,利用计算方法进行识别的效率更高。因此,寻找一个好的谷胱甘肽化位点的计算预测方法尤为重要。目前,尽管已经提出了一个预测谷胱甘肽化位点的预测器,但仍需要考虑一些问题。首先,Sun’s预测器使用的数据集太小,并且没有用独立测试集来验证自己的预测器,随着越来越多的谷胱甘肽化位点被实验证实,有必要对预测模型进行修改。第二,没有系统的研究谷胱甘肽化位点周围的生物特征。基于上述问题,提出了PGluS方法,利用了从dbGSH数据库搜集的最新数据。为了提取最有信息的氨基酸特征,并且显示这些特征在预测中起到的重要作用,本文利用多个特征描述符,如k-spaced氨基酸组成对(CKSAAP)和分组重量编码(EBGW)。结果表明,PGluS达到准确率为71.41%,敏感性为75.53%,特异性为67.32%,MCC为0.431。这表明PGluS方法是很有前景的。但是以上这些方法仍然存在许多不足之处。首先,所提出的预测器的整体性能仍然是不完全令人满意的,仍有提高预测性能的空间。其次,现有的预测方法忽略了物种之间的差异,把所有物种的谷胱甘肽化位点视为通用的位点然后开发一个通用模型。为了解决现有方法的不足,本文开发了一种新的基于支持向量机的计算工具,称为SSGlu。这是专门用来识别基于多序列特征特定物种的谷胱甘肽化位点的方法。特征包括二进制编码的氨基酸序列文件(BE),氨基酸组成(AAC),氨基酸理化属性(PCP),自相关函数(ACF),位置特异性打分矩阵(PSSM)。利用两步特征选择方法选取最佳特征子集。通过5折交叉验证,SSGlu的AUC值在人和小鼠两个物种模型分别到达了0.8015和0.8041。此外,与现有的方法相比,SSGlu拥有更高的MCC和AUC值。表明SSGlu在预测谷胱甘肽化位点方面是很有前景的。本文还提供了SSGlu在线服务器,方便用户在线进行预测。
其他文献
河流生态系统主要由河流生境和水生生物群落构成,受到自然环境变化和人类活动干扰的影响。近年来,随着城镇化的加快,土地不断地开发利用,河流生态系统遭到破坏,河流生境变差,
为了保持生态系统的可持续发展,近年来,许多学者针对生物资源的合理开发问题进行了深入研究并取得了重要结果.本篇论文主要讨论了带有捕获的扩散生物模型的动力学行为,首先研
竞争关系是生物种群种间作用的重要关系之一,具有重要的现实意义.生物学研究显示,在近缘种之间的竞争,除了资源竞争外,还有可能涉及到交配竞争.因此,本文综合考虑资源竞争和
本文研究一类饱和发生率的随机SIR模型(3)。不同于一般的随机模型,我们的模型带有两种类型的扰动,使得模型的解不再具有一致有界性,而且扰动是双线性型的。我们证明了该类型
真枝藻属(Stigonema Ag.)隶属于蓝藻门(Cyanophyta)真枝藻目(Stigonematales)真枝藻科(Stigonemataceae)。该属物种具有复杂真分枝,并且是真枝藻科中种类最多的一个属,也是真
目的:探讨系统性红斑狼疮(SLE)患者中性粒细胞(PMN)活性氧族(ROS)和自然杀伤细胞(NK细胞)γ-干扰素(IFN-g)水平的改变及二者的联系在疾病中的作用;同时比较SLE患者和健康对照者中性粒细
本文主要研究了如下变系数波动方程的反源问题.其中G(?)Rn是一个有界区域带有C2边界aG,a(x)>0,T>0.我们的反问题要通过适当的边界观测值来确定源项f.为了解决这一问题,我们首
数字图像分割与抠图都是计算机视觉中重要的技术,在图像处理与信息提取中发挥着重大作用。目前在分割与抠图问题上仍然存在一些有价值的研究课题,一是在图像分割中如何实现对图像中不同层次与尺度的信息进行有效地整合利用,获得准确的分割结果并提升细节精度;二是在图像抠图中如何更好地处理高透明度的物体以及前景背景颜色分布相似的区域。这是分割与抠图中极具挑战性的问题。针对图像分割问题,本文提出了基于注意力机制的富卷
本文研究双相Stefan问题的自由边界x=s(t)终端位置s(T)的能控性问题.其中,对i=1,2,a2=pi-1Ci-1表示扩散率;pi表示密度;ci表示热容量;Ki=pi-1L-1,L是潜热.上述所有常数都是正数.T
本文研究的是伪抛物控制系统的稳定性.考虑的系统如下:其中,?=[0,1].首先,我们做的工作是证明系统解的存在唯一性.在观察系统后,我们做了一些变化并利用分离变量法把解的具体