论文部分内容阅读
针对目前凋亡蛋白的亚细胞定位预测精度不高的问题,提出了基于集成学习和基因本体(GO)标注库的细胞凋亡蛋白亚细胞位置预测方法.该方法采用凋亡蛋白及其同源蛋白的 GO 特征,结合两层集成策略,预测凋亡蛋白的亚细胞位置.在第一层,依据不同同源蛋白个数生成多个特征向量集合,选取距离权重 K 近邻分类器作为个体分类器,训练多个子预测模型,并以多数投票的方式集成.在第二层,将第一层的集成模型作为子预测模型,以多数投票的方式集成不同近邻个数预测模型.Jackknife 检验结果表明:该方法在 CL317凋亡蛋白数据集上