论文部分内容阅读
基于决策树的基因芯片数据分析方法以追求样本最大分类正确率为目标,造成大量的部分相关基因被排除,不适用于挖掘复杂疾病的相关基因.为此,提出了特征基因挖掘的决策森林方法:从多组特征子集中识别重要疾病相关基因,每个子集根据自身对目标的分类能力被识别;通过抽样技术产生大量不同结构的训练样本,可以挖掘出高相关或部分相关基因.数值分析结果表明,该方法是生物类型分类和疾病相关基因挖掘的有效工具.