论文部分内容阅读
利用支持向量机对未知样本进行预测时,由于差异表达基因的作用容易被大量的噪声所掩盖,其判别效果通常不是十分理想。若能够对分类的主要特征进行适当的提取,即采取某种基因筛选的方法,尽可能将对分类不起作用的冗余噪声基因筛除,然后在此基础上建立统计判别模型,通过较少的差异表达基因实现临床诊断有重要的意义。但选择何种基因筛选的方法,所建立的模型能否能达到预期的效果,是一项具有挑战性的工作。本文结合SAM筛选基因的方法,按照基因重要性排序,通过迭代算法自动选择"最优"支持向量机分类模型,然后用实际基因表达数据考核其应用效果,并用R语言编程通过模拟试验验证其有效性。