基于贝叶斯网络的分类算法研究及其在CRM中的应用

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:qijing1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从数据挖掘的角度上看,分类问题就是要建立相应的分类模型或者分类规则,使用构建好的分类模型将未知分类的样本映射到某一个类中。贝叶斯分类法以其坚实的理论基础和良好的分类性能受到研究人员的青睐。朴素贝叶斯分类的改进算法和贝叶斯网络结构的学习是贝叶斯分类研究的两个方面。本文的重点在于前者。贝叶斯分类就是要在假设空间内寻找具有最大后验概率的类,将未分类的样本归到这个类中。朴素贝叶斯分类器(Navie Bayesian,NB)是一个经典的贝叶斯分类器。NB基于所有的属性是条件独立的。在属性相关性较弱的情况下,NB具有同决策对,神经网络相当的分类性能。在实际NB其严格的条件约束性不能反映属性间的关联性,降低了它的分类精度。许多改进算法是基于放松其条件约束性这一思想的。TAN的每个结点除了类结点作为其父结点外,还允许至多一个非类结点作为其父结点。TAN在许多样本集上具有优于NB的分类性能。每个属性对分类的影响程度是不同的,那么如何表示不同的影响呢?属性相关性可以度量属性间的关联性。   本文介绍了多种不同的相关性分析法。属性相关性有多种应用,如基于属性相关性的属性约简,基于属性相关性的加权模型,基于于属性相关性的属性分组。本文在介绍完属性相关性分析法后,描述了基于这些分析法的加权模型。属性关联性分析的另一个应用是属性分组。将所有的属性根据一定的度量标准将它们划分成强属性集和弱属性集。强属性集中的属性对分类影响较大,相对的弱属性集中的属性对影响程度较小。基于不同的相关性定义产生了多种不同的划分标准。本文在介绍了几种强属性的选择法后,提出了自适应的选择法,基思想是通过不断的调整尝试多种划分最后选择具有最好分类性能的划分。另外,在强属性选择的基础上,提出了在不同的属性集上使用不同的分类算法的混合贝叶斯分类模型。该模型首先使用自适应强属性选择方法划分强属性集和弱属性集,然后对强属性集中的属性使用TAN分类器而对于弱属性集中的属性使用朴素贝叶斯分类器。在本文中还介绍了部分分类模型的实现细则。最后通过对比实验验证改进的混合分类器的分类效果,实验表明该混合分类器在部分样本集上分类性能高于NB和TAN分类器。文章在最后章节还介绍了CRM的相关描述及贝叶斯分类器在CRM的应用。
其他文献
随着人类社会日益网络化,现实网络系统变得越来越复杂甚至难以预测,然而人们对网络的安全性和稳定性提出的要求却越来越高。因此,对复杂网络的稳定性研究已成为人们普遍关注的热
随着国民经济的快速增长和社会的进步,银行、电力、交通以及军事设施等领域对安全防范报警系统的需求与日俱增,对智能视频监控技术的应用及发展提出了更高的要求。行人检测与
随着中国城市化的发展和土木工程技术的进步,城市中各种民用工程建设发展很快。而对这些桥梁、大坝、隧道等建筑物以及电力电缆等方面的健康状态的监测,根据关键部件的特征信
生物模型可以模拟系统行为,预测系统未知的行为和特性,从而测试生物学家提出的假设,进行一些实验条件无法达到或非常耗时耗力的模拟实验,它们与生物实验相辅相承,使得生物系统的研
IEEE 802.11 DCF协议以其简易性与健壮性成为目前主流的无线Ad hoc 网络的MAC协议,其基本思想是载波侦听与冲突避免。同时,DCF协议也提供了两种数据包传输机制:二次握手机制(又被
P2P网络具有良好的开放性与扩展性,同样也具有极大的动态性和差异性。正是这样的特性,使得将P2P技术引入VoIP这类对网络环境要求较高的应用带来系统整体性能提升的同时,用户
科学技术推动世界的发展,科技的力量正影响着我们生活、学习和工作。矿产资源管理信息化作为矿产资源管理工作与现代信息技术的结合点,对促进高效管理、科学决策、依法行政,进
基于特征造型技术的三维CAD系统目前已广泛应用于产品设计。随着三维建模技术的发展,CAD系统中包含越来越多的几何特征。含有丰富特征的CAD模型被广泛应用于产品发展的各个阶
cDNA微阵列和寡核苷酸芯片等高通量检测技术的成熟应用,产生了大量的基因表达数据,其中包括静态数据和时序数据。基因表达时序数据反映了生物基因在时间进程上的特性,对其进
随着并行与分布式系统的发展,并行计算机中处理器数量大量增加,处理器之间的互连网络的性质显得越来越重要。同时,在具有大量处理器的系统中,处理器发生故障的情形变得不可避