论文部分内容阅读
微阵列数据具有样本小、维度高的特点,给数据分析带来了困难.因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的.本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比.利用挑选出的主基因,采用支持向量机(SVM)对数据样本进行了分类研究.通过实验,在经典的白血病数据集上,对于34个样本的测试集,达到了33/34的分类准确率,表明了本方法的适用性.