论文部分内容阅读
利用分散量的数学理论,提出了基于最小分散增量的蛋白质序列辨识方法.通过多种特征联合对蛋白质序列进行编码,并建立基于最小分散增量的分类器MID_OMP,应用于革兰氏阴性细菌外膜蛋白序列辨识.在数据集上的Jackknife测试中,MID_OMP辨识外膜蛋白和α螺旋跨膜蛋白的准确率达到95.7%,辨识外膜蛋白和球状蛋白的准确率达到91.0%:在14个细菌基因组内挖掘结果显示,MID_OMP具有较高的敏感性和特异性.预测结果的可信度明显优于另外一种OMPs挖掘工具TMBETA—GENOME.