论文部分内容阅读
针对改进F-score特征评价准则没有考虑特征测量量纲对特征重要性的影响,提出一种新的特征重要性评价准则D-score,避免不同特征测量量纲的影响,衡量样本特征在两类或多类之间的辨别能力。将D-score分别与前向顺序搜索、前向顺序浮动搜索两种搜索策略结合,以支持向量机的分类准确率评估所选特征子集的有效性,结合Filter和Wrapper特征选择方法的优势进行特征选择,得到两种混合特征选择方法。将该方法应用于红斑鳞状皮肤病诊断研究,并与基于改进F-score的混合特征选择方法进行了实验对比。十折交叉验证实验结果显示:在红斑鳞状皮肤病诊断研究中,D-score特征评价准则优于改进的F-score准则,基于D-score和前向顺序搜索策略的诊断准确率提高1.11%;D-score结合前向顺序浮动搜索策略的最低诊断准确率提高约3个百分点,平均诊断准确率提高约0.3个百分点,最高诊断准确率达到100%。前向顺序浮动搜索中,D-score准则选择的共有特征是改进F-score准则所选择共有特征的子集。所提出的D-score特征重要性评价准则是一种有效的特征区分能力度量准则,在红斑鳞状皮肤病的诊断中选择出了更有分类意义的特征,提高了诊断准确性。