论文部分内容阅读
随着信息技术的快速发展,人们急切需要一种能从大数据中提取有用信息的技术.数据分类技术是一种重要的数据分析技术,可以用来建立描述重要数据类的模型,从而预测数据未来的趋势,帮助人们高效管理和有效利用信息.其中,利用贝叶斯网络对数据进行分类成为研究的热门之一.本文在分析几种常用的数据分类方法、属性降维、分类性能评估和多维贝叶斯分类器的基础上,研究了多维贝叶斯分类器.为了简化多维贝叶斯分类器模型的复杂度,同时去除属性变量中可能存在的冗余属性和无关属性,利用独立分量分析方法对属性变量进行降维处理,且处理后的属性变量相互独立,这使得多维贝叶斯分类器的学习更容易实现.本文将三组经典数据的仿真实验结果与已有方法的结果进行比较,结果表明处理后的属性变量建立的分类器分类效果优良.