论文部分内容阅读
由于学习样本的分布特性和所反映的主观特性的不同,每一个样本相对于学习算法的重要性程度往往是不对等的,为了能够在知识约简过程中考虑到学习样本的不对等性,提出了基于加权熵的知识约简方法。针对各类别样本分布不均匀的样本重要性不对等情况,为了加强小类样本所蕴含的知识在知识约简中的体现,提出一种逆类概率加权的不对等样本加权方法,实验表明该方法能够明显提高小类样本的分类正确率,也验证了基于加权熵的知识约简方法能够将样本的不对等性体现在知识约简结果中。