论文部分内容阅读
为了从高维、小样本的基因表达数据中有效地选择特征基因,消除与肿瘤分类无关的数据,提出一种随机矩阵替换与支持向量机的肿瘤信息基因选择算法(RD-SVM)。首先构建多组0/1随机向量表示的信息基因子集,并以支持向量机构建分类器评价每组子集的优劣,然后考虑各特征之间的相互作用,以0、1替换策略对基因子集评估,并找到最优基因子集,最后采用5个肿瘤信息基因表达谱数据对算法性能进行测试。结果表明,相对于参比算法,RD-SVM算法不仅提高了肿瘤信息基因的识别精度,同时所选信息基因最少。