论文部分内容阅读
针对肿瘤基因表达谱样本少、维数高的特点,提出一种用于肿瘤信息基因提取和亚型识别的集成分类器算法。该算法根据基因的Fisher比率值建立候选子集,再采用相关系数和互信息两种度量方法,分别构造反映基因共表达行为和调控关系的特征子集。粒子群优化算法分别与SVM和KNN构成两个基分类器,从候选子集中提取信息基因并对肿瘤亚型进行分类,最后利用绝对多数投票方法对基分类器的结果进行整合。G.Gordon肺癌亚型识别的实验结果表明了该算法的可行性和有效性。