论文部分内容阅读
在分类任务中,特征选择是一种提高分类效果的重要方法。现实生活中的数据都是存储在多关系数据库中的。多关系数据库的数据中有许多不相关的且冗余的特征,这些特征对分类任务的贡献很小,甚至没有贡献。如何有效地将特征选择应用到多关系分类中是比较重要的。因此,将最大相关最小冗余的特征选择方法应用到多关系分类中,对关系数据库中的每个关系表进行特征选择,选择出对分类影响较好的特征集,再用多关系朴素贝叶斯分类算法对进行特征选择后的多关系数据库进行分类测试。实验结果表明了该算法的性能有了一定的提高。