论文部分内容阅读
依据多关系数据库中的背景表对分类任务具有的不同大小贡献度,提出一种基于关系选择的多关系朴素贝叶斯分类算法。对关系表进行两轮删减,根据最大信息增益率删掉部分对分类影响较小的关系表,把平均信息增益率作为衡量表对分类的贡献度,根据贡献度选定余下的表用于最终的分类。实验结果表明,该算法能有效提高分类准确率,相比Graph-NB算法、Classify_tables算法及MRNBC-W算法分别提高2.2%,1.1%,0.86%。