论文部分内容阅读
贝叶斯网络在很多领域应用广泛,作为分类器更是一种有效的常用分类方法,没有任何结构限制的贝叶斯网络有着很高的复杂度,这使得它在应用中受到诸多限制。为了使贝叶斯网络分类器在面对较多属性及较大数据集时更有效率,并且可以得到更符合实际的贝叶斯网络模型,这就有必要研究优化的模型学习方法。通过对贝叶斯网络分类器算法的近似处理,可以有效减少计算量,并且得到令人满意的分类准确率。贝叶斯网络分类器按照学习贝叶斯网络结构时评分函数的不同可以分为产生式贝叶斯网络分类器和判别式贝叶斯网络分类器。它们有着各自的优势与不足,产生式模型计算较简单但结果准确率一般,而判别式模型准确率较高但计算较繁琐。对于产生式模型,本文分析了BIC评分函数的性质,据此就能在贝叶斯网络结构学习时降低搜索空间,加快算法的搜索速度。本文将此性质与K2搜索策略相结合,提出了K2-aBIC分类器算法。使得该分类器在学习贝叶斯网络模型结构时进一步减少了搜索空间,使分类器更加高效。实验表明了K2-aBIC分类器在保证其分类准确率的情况下效率有所提高。对于判别式模型,本文分析了一种将分类器判别式评分函数通过近似学习转化为可分解的产生式评分函数的方法。然后对使用这种方法得到的aCLL分类器进行研究,发现其具有稳定性较弱的特点,提出了用集成思想来对其进行改进的思路,并得到了Bagging-aCLL分类器算法。实验证实了Bagging-aCLL分类器的分类性能得到了一定加强。由此可见,对贝叶斯网络分类器的近似学习可以使其在准确度与执行速度方面取得较好的平衡,既能得到与实际情况拟合程度较高的贝叶斯网络分类模型,又降低了学习这种模型所需要的时间。