贝叶斯分类器在聚类中的应用

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户:yxz_89
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
贝叶斯分类器作为著名高效的有指导学习算法之一,受到广泛的关注,但是其在聚类分析(无指导学习)上的应用还非常有限,基于贝叶斯分类器的聚类算法和其它常用聚类算法的比较工作几乎没有。 在论文中,作者设计并实现了一个新的算法,该算法结合贝叶斯分类器(Bayesian Classifier)和Expectation Maximization(EM)算法做聚类分析,简称这个方法为-"BC+EM"。 论文作者首次将BC+EM算法集成到weka中,这个算法可以随意地选择任何贝叶斯分类器来做聚类,它在聚类和分类之间建立了直接的联系。为了算法系统比较的目的,作者首次在weka中建立起了聚类算法比较的试验环境,该项工作对于世界上其他机器学习研究人员做聚类算法的比较是非常有帮助的。 文中选择了四种有代表性的算法-EM,K-Means,Cobweb以及Farthest First和BC+EM比较。其中,EM是基于混合模型的聚类算法,K-Means是基于距离的聚类算法,Cobweb是基于层次的聚类算法,Farthest First结合了基于距离和基于层次的混合聚类算法。我们对这五种算法做了系统的比较,选用的数据是36组不同大小和复杂度的国际通用的标准数据集。试验结果表明BC+EM在大部分数据中明显地胜出其它四种算法。
其他文献
近年来,计算机系统的功耗问题越来越受关注。高效的能量利用能延长移动设备电池的使用时间,降低个人计算机和服务器的使用成本,减小对环境的影响。在计算机系统的部件中,磁盘的功
本文主要讨论了一种全新的互联网络资源寻址定位技术——Handle服务器系统的研究与实现。作者介绍了Handle协议的基本理论,分析了Handle系统的特点,以及在实现上的必要性和可行
包装辅助设计是一个方兴未艾的产业,纸盒包装又是包装业的重中之重,而在包装辅助设计中,包装效果的三维仿真是一个包装辅助设计软件不可缺少的重要组成部分,其质量的好坏直接影响
在计算机网络世界中,无线网络起到了越来越重要的重要,移动手机GSM网络已经在全世界广泛部署,无线局域网络在IEEE802.11系列标准的推动下也越来越完善,本文介绍了一种新型的无线
传感器网络(SensorNetworks)综合了传感器技术、嵌入式计算技术、无线通信技术和分布式信息处理技术,能够协作地实时监测、感知和采集各种环境或监测对象的信息并对其进行处理
互联网和信息技术的空前发展,加速了人类活动信息的产生,互联网信息总量急剧增加,人们对信息的获取和处理的需求不断提升,需要更加智能化和定制化的网络爬虫,以满足不断增长的网络
与一般的软件系统相比较,实时系统具有实时性、并发性等特点,并且此类系统往往要连续运行很长时间,这对系统的健壮性和安全性提出了很高的要求。实时软件系统的复杂性和高安全需
工作流管理系统(Workflow Management Systems,WFMS)就是对多个人按照多个步骤完成的商业流程进行管理的一个主动化系统,它的功能就是在合适的时间以合适的工具将合适的数据发
网格化是未来网络服务的发展方向,网格中间件可以有效地整合网络中的计算资源和存储资源,为网络用户提供强大的计算能力支持。在网格环境下,服务广泛地分布于不同的地理位置,用户
随着互联网技术的不断发展,网络和信息技术已经成为驱动社会经济发展的重要力量,成为人们生活密不可分的组成部分。与此同时,网络与信息安全问题层出不穷,各种网络攻击造成了巨大