蛋白质二级结构预测PSIPRED方法的改进及其应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zjj008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认识蛋白质与蛋白质之间的相互作用以及了解蛋白质如何行使其生物功能,无论是对于生物学还是对于医药学都是非常重要的,而这些都需要知道蛋白质的三维结构,因此预测蛋白质的三维结构势在必行。然而,要想从一级序列直接预测蛋白质空间结构几乎不可能。已有大量研究表明,已知了序列的二级结构特征,预测蛋白质的三级结构将变得可行,因此,蛋白质二级结构预测是蛋白质结构预测的第一步。本文首先研究了如何构建一个能够更加准确预测蛋白质二级结构的模型,内容包括特征提取算法和分类算法的设计,接着本文将蛋白质二级结构信息特征应用于细菌毒蛋白预测领域,研究工作的主要内容和创新点归纳如下:(1)本文提出了一种新的特征提取算法来提高二级结构预测准确率。该方法将位置特异性打分矩阵和二面角相结合,用一个22*w(w为窗口长度)维的数值特征向量表征滑动窗口中心的氨基酸残基,再将该特征向量输入到一个双层叠加的神经网络分类模型。我们将本文提出的方法在CB513和RS126数据集上分别做了交叉验证实验,同时将交叉验证的结果和9个现有的方法做了比较,并在数据集CASP9上做了独立测试,同时将该独立测试结果和10个在线预测服务器上的得到的预测结果进行了比较。(2)由于细菌毒蛋白可以成为药物靶标或疫苗候选,因此毒蛋白的预测对新药物的设计和疫苗的研制有很重要的作用。本文提出的方法首次将基于二级结构信息的特征应用到细菌毒蛋白预测上来,分别用蛋白质序列特征(二肽,伪氨基酸组成)、蛋白质序列进化信息特征(位置特异性打分矩阵)和蛋白质二级结构特征来训练基分类器(本文用到的分类器都是支持向量机SVM),再将它们的输出决策值输入到第二层判别分类器,获得最终的预测结果。在三个标准数据集上的实验结果表明,本文提出的方法能够较好地预测细菌毒蛋白。
其他文献
高尿酸血症,是体内嘌呤代谢异常,尿酸生成过多,不能及时排泄而使血中尿酸浓度超过正常水平(成年男性208~428mmol/L,女性为 155~357mmol/L)所引起的痛风、急性关节炎、尿结石、尿酸性肾
报纸
目的:肺纤维化(Pulmonary Fibrosis,PF)是一类以间质性炎症和肺间质纤维化为主要病变的间质性肺疾病。病理表现为细胞外基质过量沉积,临床表现为呼吸困难和正常肺功能丧失等。PF发病演变可分为氧化应激、肺泡炎和纤维化阶段。丹参主要含有水溶性的丹酚酸类和脂溶性的丹参酮类化合物,两类成分又分别以丹酚酸B和丹参酮ⅡA为代表。近年来,丹酚酸类和丹参酮类化合物的制剂在临床治疗PF显示出一定疗效。
目的 子宫内膜癌是女性常见的恶性肿瘤之一,其发病率排序位于乳腺癌、肺癌、大肠癌之后列第四位,在我国占女性生殖系统恶性肿瘤的20%-30%,列第二位。子宫内膜癌的发病率和地域关系
自会计师事务所“脱钩改制”以来,财政部、中注协接连出台各类政策,以鼓励本土所通过合并来扩大规模,自此“做大做强”成为了我国注册会计师审计行业发展的一大重要主题。本
在中药种植过程中,不合理施肥现象较为严重,药农在肥料的选择上存在较大的盲目性,对中药材往往按照农作物施肥经验和习惯进行施肥,肥料作为中药材种植中较大的物质投入,其对
目的 观察及预防老年患者不易发觉的夜间低血糖发生,及时采取相应有效的措施,避免造成中枢不可逆损伤.方法住院期间采用血糖监测(必要时加测凌晨02:00~03:00血糖).需要睡前注
【目的】通过对颈椎矢状平衡参数的影像学测量及相关性分析,研究颈椎矢状平衡参数与颈椎病发生的相关性,探讨颈椎矢状平衡参数用于指导术后矢状平衡重建的可行性。【方法】选
在传统的控制系统中,串级PID控制系统对改善控制品质有其独到之处,广泛应用于在工业过程控制中。串级PID控制系统适用于具有容量滞后较大、纯时延较大、扰动变化激烈而且幅度大、参数互相关联、非线性等特点的工业生产过程。然而,随着科技的不断进步,人们对过程自动化的要求也越来越高,传统的串级PID控制系统有时难以满足过程控制的更高要求。因而,运用先进控制算法改进原有的串级PID控制系统,来保持生产稳定、降
“从案到人”的侦查模式在案件侦破过程中始终发挥着重大的作用。“从人到案”的模式弥补了传统侦破方法的不足,体现了“主动进攻,先发制敌”的战略思想,日益显示出其重要价
<正> 梅兰芳先生的表演艺术特点,是“以少概多”,犹如古代的五言绝句,在短短的二十字里,含义极丰,意境深远,格律严整,余味无穷。 “少”决不意味着简单,而是精炼。表演艺术做