面向CRM的贝叶斯分类算法及并行化研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qaz1164
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展和企业竞争的加剧,数据挖掘越来越多地应用于企业的生产和管理中。这一趋势的持续和企业数据的膨胀,只靠传统的单机已难以胜任,此时采用并行处理技术是解决效率问题的有效途径之一。在数据挖掘的基础上,加上管理思想、管理技术的不断发展,客户关系管理(customer relationship management,CRM)已逐渐在企业中推广应用。接触点管理、提高客户的赢利能力、客户的细分、交叉营销等是客户关系管理的重要组成部分。从数据挖掘的观点来看,它们都与分类算法密切相关。因此研究好分类算法对于企业充分利用CRM,意义十分重大。分类算法常见的有判定树归纳分类、贝叶斯分类和贝叶斯网络、k-最临近分类、粗糙集方法以及模糊集方法。实际应用中对这些算法进行取舍时,可以从准确度、速度、伸缩性、强壮性和可解释性等几个方面来评价。综合这几个指标,贝叶斯分类算法的优点较为突出。该算法基于贝叶斯定理,可解释性方面可以与判定树相比,准确度可和神经网络分类算法相媲美,用于大型数据库时该算法已表现出高准确度与高速度。朴素贝叶斯分类算法应用于连续属性值时并不太理想,为此本文结合Holte的1R离散化方法和熵的原理,提出了一种新的离散化方法。该方法至下而上地合并区间,不分解区间,也不采用熵的离散化方法所用的递归进程,更避免了熵方法中必须对每一个值进行试探来选择分割点的弱点。集群系统有与专用的并行系统相竞争的性能,其性价比已占优势,其中的PVM应用相当广泛。本论文在PVM的基础上研究并实现了优化贝叶斯算法的并行化,并且分析了该算法的加速比和时间复杂度,分析表明在类比较多、或者待分类的数据样本比较多时,用该并行算法可以较大幅度提高数据分类的效率。论文最后讨论了该并行算法在企业中的应用模式及意义,进一步说明所涉及并行贝叶斯分类算法的实用性。
其他文献
该文围绕数据挖掘技术,观察探讨数据挖掘技术在电力系统电厂中的应用现状,认为在电力系统中,数据挖掘技术有广阔的发展空间和前景.研究了数据挖掘的主要理论和技术,数据挖掘
工作流管理系统WfMS(Workflow Management System)是近年来随着Internet和Intranet的普及而快速发展的软件系统之一。工作流管理系统的主要目标是通过调用有关信息资源与人力资源来协调业务流程中的各个环节,使之按照一定的顺序依次进行,从而实现业务流程的自动化。 目前国内外虽然已经有了很多工作流管理系统的产品,但是它们大部分只能在工作流定义时对其进行修改,一旦
嵌入式实时操作系统开发是近年来研究的一个热门课题。基于Linux的开发方案有其固有的优势和劣势,如何增强Linux系统的实时性能是急待解决的关键问题之一。 本文首先介绍了
学位
随着计算机网络技术的飞速发展,特别是自INTERNET技术为全世界广泛应用以来,社会信息流通能力得到了迅速提高,在很大程度上推动了整个社会的发展.中国虽然起步较晚,但发展速
本文在不确定时间点的时态关系基础上给出了不确定时间区间的定义和“同时”时态关系。由于病历数据的特点和关联规则挖掘的要求,采用附加约束并包含复合项的DHP算法,结合不确
软件测试是软件开发周期中重要的一环,用于检测软件存在的故障和缺陷,是保证软件健壮性和安全性的主要途径之一。随着软件的复杂性和规模的增加,软件测试的开销也进一步上升,自动
面对海量的信息,人们已经无从选择。信息开始从用户主动获取演变成系统根据用户的需求和喜好进行个性化推荐,推荐系统应运而生,并迅速得到广泛研究和应用。协同过滤的算法是目前
生物界中昆虫或动物的迁徙行为对于种群的生存有着至关重要的作用。为了维持物种的生存与稳定,生物界一些群居动物有着严格的等级制度和职责分工。这种严格的等级制度,确保了个
创建逼真的三维人脸模型是计算机图形学领域一个极富有挑战性的课题。随着虚拟现实、影视制作、游戏娱乐、可视电话等应用的发展,这一研究领域越来越受到人们的关注。本文主要