基于显现模式的懒惰式贝叶斯分类方法

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:temp_dl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分类是数据挖掘的一个重要课题。随着数据规模与维数的增加,建立高效的、适用于大型数据集的分类算法已成为数据挖掘的一项挑战性任务。基于显现模式(Emerging Patterns,EP)的分类方法是针对大型数据集的分类提出的一种有效方法。EP作为一种新的知识模式,其能够捕获目标类和非目标类上多组属性之间的差异,具有很好的分类性能。本文首先介绍了分类的相关概念及基本技术;随后详细介绍了显现模式的基本概念、性质,显现模式的挖掘算法以及应用显现模式进行分类的一般方法;进而,深入比较了目前已有的几种基于EP的分类方法。在此基础上详细地设计与实现了一种基于显现模式的决策分类(DeEPs)方法,并以此算法为基础提出了改进策略,提出了一种新的基于EP的分类算法,即基于基本显现模式的懒惰式贝叶斯分类算法(Lazy Bayesian Classification based on essential Emerging Patterns,LBCeEP),并分析了算法的可行性和正确性。该算法使用懒惰式学习技术进行训练数据集的约简,并使用了一种特殊形式的EP,这种模式更能有效地反映类标属性,同时采用贝叶斯方法应用这种EP来进行分类,并且解决了参数的自适应选择等问题。通过实验进行了与NB,C4.5,TAN以及DeEPs算法广泛的比较与分析,实验结果表明该算法具有较好的分类性能。
其他文献
近年来,运动捕获技术逐渐成熟,并广泛应用于影视制作、游戏设计和体育训练等领域。随着运动捕获数据的逐年积累和运动编辑、合成等技术的飞速发展,使得高效地重用现有的捕获
跨膜蛋白在离子通道型受体等生物系统中有着重要的作用,是药物设计的关键目标。通过物理实验来获取它的结构难度很大,使用计算的方法成为当前非常流行和有效的方法。目前,跨膜蛋
利用人工图像标注结果作为索引信息并且使用此信息检索图像库是一种昂贵而费力的过程。与此同时,自动图像标注由于在图像理解和检索方面的潜在巨大影响而逐渐受到人们的重视
P2P网络完全对等的特性使P2P网络技术得到广泛应用,为用户提供了极大的自由和便利。P2P网络技术有效整合了Internet的潜在资源(包括存储资源、计算资源和内存资源等)。借助其
网格通过组织各种网络空闲资源,为用户提供方便强大的服务接口,以实现计算资源、存储资源、数据资源等的全面共享。已有的计算网格系统都存在中心管理节点,网络通信和管理开销制
随着软件逐渐成为人们日常的一部分,人们对软件的质量和可靠性的要求也越来越高。作为业界保证软件质量的主流技术,软件测试是一个用来检查开发软件的正确性、完整性、安全性
目前突发公共事件及各类自然灾害频繁发生,对突发事件进行分析、预防和应急响应的城市应急联动系统应运而生。然而构建城市应急联动系统所需的数据资源大多处在孤立分散的状
随着计算机网络技术的发展和我国信息化进程的不断推进,计算机网络在人们的日常工作中发挥着越来越重要的作用。目前,大部分的企业或机关单位都组建了内部的局域网,实现了资源共
随着SOA应用的不断深入,大规模服务管理及Web服务自动化处理的重要性不断增加,而当前SOA体系的基础设施已经难以满足这些新的需求,构建新的SOA体系的基础设施已经成为越来越
随着计算机技术的迅速发展,计算机游戏逐渐成为人们最重要的娱乐方式之一和IT行业中最重要的利润增长点。如何在计算机游戏中模拟人类智能,增加游戏的娱乐性和互动性,已经开始受