论文部分内容阅读
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jack-knife检验