基于AdaBoost的限制性贝叶斯组合分类器研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:eight92
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘领域中,分类是一种非常重要的技术。分类器集成技术是将多个不同的单分类器组合成一个分类器,以提高原分类器的分类性能。其中,AdaBoost算法是一种典型方法。限制性贝叶斯分类器是分类技术研究领域的热点之一。 本文首先介绍分类的概念以及相关技术。其次,叙述了分类器集成相关技术,包括Bagging、Boosting和Stacking,重点分析了Boosting方法中AdaBoost算法的理论基础与关键步骤。进而,在阐述限制性贝叶斯分类器的相关概念和理论基础上,分析了朴素贝叶斯分类器、TAN分类器、爬山法分类器和SP分类器的理论基础和分类器结构,比较各个算法的优缺点,并且在Weka平台上实现了这些分类器。另一方面,还分析了隐藏朴素贝叶斯HNB分类器,包括概念、分类器的结构以及隐藏节点的构造过程,描述了该算法流程。在这些研究工作的基础上,提出了一种新的组合分类器算法BoostTHNB。该算法在HNB分类器的基础上引入了一颗树的结构,在树的叶子节点上创建了HNB分类器;树节点分裂方式依据HNB分类器的训练错误率,如果分裂后子节点的训练错误率小于原来未分裂的训练错误率则进行节点分裂,否则不予分裂。改造后的分类器称之为树形隐藏朴素贝叶斯THNB分类器;再以AdaBoost算法作为分类器集成的方法,将THNB分类器作为基分类器进行分类器组合。最后,通过实验比较了新组合分类器和原有隐藏朴素贝叶斯分类器以及一些经典分类器算法,包括朴素贝叶斯分类器、TAN分类器和决策树分类器。实验结果与分析表明,该组合分类器在绝大多数数据集上可以提高原有分类器的分类性能。
其他文献
车辆牌照识别是智能交通系统(ITS)的一个重要组成部分,尤其是复杂背景下的车牌识别,有着广泛的应用领域和美好的应用前景,其发展必将大大加速ITS进程。本文针对目前车牌识别
电动机是所有自动设备的动力之源,磁瓦是电动机中的一个主要组成部件,其性能关系到电动系统的可靠性、稳定性和安全性。对于功能面的缺陷,必须在检测时予以剔除,以免装入电动机后
物联网技术、云计算、大规模高效能计算的蓬勃发展催生了以“制造即服务”为理念的云制造模式。随着这种模式的深入推广,越来越多的资源接入到云制造虚拟资源池中,资源提供商、
随着信息技术的不断发展,Web上的信息量呈爆炸性增长。按照所蕴含信息深度的不同,可以将Web划分为Surface Web和Deep Web两大类。其中,Deep Web是指那些存储在Web数据库里、不能
信息技术的发展,使得多媒体通信技术也日新月异地变革着。而视频直播系统作为多媒体通信技术的一个典型应用,在发挥着越来越重要的作用。随着计算机网络的发展,在网络上传输视频
近年来,随着人们对人机交互兴趣的增加,表情识别逐渐成为一个研究热点。人脸表情识别是指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机之间更自
伴随着网络技术和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源,并成为人们生活的重要组成部分。如何传输大量的多媒体信息并如何保护其安全成为国际上研究
互联网技术的推广,使得数字校园也正在飞速的发展。随着数字化校园建设的逐步完善和发展,各种基于校园网的应用系统风起云涌。各种应用系统独立认证的弊端使得校园网络集中管
目的:随着Web技术的飞速发展,一种新的、基于Internet构建的医学影像存档与传输系统受到越来越多的国内外学者的关注。本课题应用Java技术开发一个基于Internet的操作简易、通
Internet作为一个庞大的信息资源库,已成为人们获取信息的主要途径之一,也是教育资源的重要来源。但是,随着网上资源爆炸式地增长,人们在Web上找到自己感兴趣的资源越来越困