论文部分内容阅读
在绿色植物和藻类细胞中,叶绿体是其生命活动的主要场所,同时也是进行光合作用和能量交换的细胞器。亚叶绿体定位研究是比蛋白质亚细胞定位更深层次的问题,而且准确定位亚叶绿体的各亚细胞位置更有利于了解它所发挥的功能,因此这成为近年来蛋白质亚细胞定位的一个新的研究课题。 本文从Swiss-Prot数据库中搜索蛋白质亚叶绿体信息数据并进行筛选,最终建立了新的相似性小于等于60%的蛋白质亚叶绿体数据集PS60,其中包含三个亚细胞位置。我们计算了基于蛋白质序列的氨基酸单肽分段组分信息、氨基酸间隔二肽耦合信息和氨基酸指数信息,预测的蛋白质二级结构信息和蛋白质骨架信息,并结合蛋白质亚细胞定位中运用较为成熟的基于生物过程和分子功能的Gene Ontology注释信息,以及基于PSSM矩阵的蛋白质的进化信息与保守信息,并将它们作为预测亚叶绿体位置的特征参数,筛选得到最优参数组合。利用支持向量机算法(SVM),Jackknife检验的总体预测成功率达93.35%。在独立测试和交叉验证下的结果分别为90.65%和93.72%,都取得了比之前的亚叶绿体定位的相关研究更好的结果。