论文部分内容阅读
蛋白质序列种类繁多,形态、结构和功能极其丰富多样,而已知三维结构的蛋白质数量却非常有限.为了能够利用有限的已知结构模拟和预测未知蛋白的结构,小样本统计学技术非常重要.本文主要探讨统计学习理论应用于蛋白质二级结构预测的模型,说明支持向量机(SVMs)进行蛋白质二级结构模式识别的主要步骤,讨论利用SVMs预测蛋白质二级结构优化过程中样本空间的确定方法,研究氨基酸序列向量化途径以及分析如何选择映射输入空间到特征空间的核函数等问题.