论文部分内容阅读
蛋白质是一切生命活动的物质基础,研究蛋白质的相互作用有助于理解生物过程的分子机制,阐明疾病的分子机理。本论文依据蛋白质序列组分特征,应用基于离散增量的二次判别分析方法,对人类的1962对蛋白质相互作用进行了预测。自洽检验的各项预测指标均在75%以上,且3折交叉检验的总精度也大于64%;对酿酒酵母的4548对蛋白质相互作用预测,5折交叉检验的总精度大于61%,相关系数为0.22。
同时我们也将离散增量结合二次判别分析方法应用于人类DNA甲基化位点预测的问题。结果显示,在截取79bp长的序列片段时,以8-mer频数为属性的IDQD模型的预测性能最好。5-fold交叉检验的整体预测准确率为80.03%,相关系数为0.60。
基于以上两个工作的结果可以证明离散增量结合二次判别分析的方法能有效的解决复杂的生物学问题,是一种性能优良的分类器。