基于最大间隔的多类聚类与二叉树构造问题研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:clarrencewarren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是一种重要的数据分析技术,在数据处理,文本分析,图像搜索等方面都有广泛的应用,因此受到人们的广泛关注。支持向量机(SVM)是一种新的有监督机器学习算法,具有良好的分类性能和泛化能力。Xu L.将支持向量机最优超平面理论推广到聚类算法,提出一种新的聚类算法——最大间隔聚类,该算法主要是对无标签样本,通过寻找一组最优的样本标签使得聚类后得到的两个样本簇之间的间隔最大,具有良好的聚类性能。然而,最大间隔聚类主要是针对两类问题的一种聚类算法,对两类问题有较高的聚类效率,本文从二叉树的构造出发,将该两类最大间隔聚类推广到多类聚类中,通过构造二叉树来将多类聚类分成多个两类最大间隔聚类,从而完成了最大间隔聚类的普遍性推广。本文在最大间隔聚类算法基础上,通过二叉树的构造,提出一种基于最大间隔的多类聚类算法。首先,本文对传统的聚类算法做了一个大概介绍,提出传统算法存在的一些问题;同时对SVM理论进行深入剖析,提出最大间隔概念,对SVM良好的有监督分类性能进行探讨并且将其推广到无监督聚类中。其次,对最大间隔聚类算法的具体原理和实现进行了详细说明,并且分析了算法的不足,提出一种改进算法并将改进的最大间隔聚类通过构造二叉树将其推广到多类聚类中,对本文的多类聚类算法步骤和算法流程进行了详细说明,最后,通过实验数据证明了算法的可行性,并且与传统K均值聚类进行聚类错误率对比,得出本算法有较低的聚类错误率。
其他文献
期刊
期刊
期刊
期刊
2月19日至21日,中央电视台2008年工作会议召开。国家广电总局副局长赵实代表广电总局党组充分肯定中央电视台2007年工作,并从全国广播影视发展的高度,对中央电视台2008年工
传染病历来是人类的大敌,利用动力学方法建立传染病传播的数学模型,并通过模型对传染病进行定性和定量的分析与研究已经取得一些成果,主要集中在判定、预测疾病发展趋势上。
犹太人认为,在商业或私人交际中,无言常常是最好的选择之一。与善于交谈的人谈判,如果您能倾听对方说话,最后您肯定是赢家。  犹太人有一句老话:雄辩是银,沉默是金!且不论这句话对不对,在我们研究要怎么说话之前,应该先了解要怎么不说话,因为言多必失。而遵循这一原则会让人受用无穷,个人的威望会因为沉默而得到提升。  人们从来都希望了解别人头脑中的想法,而把自己的思想封闭起来,不让别人窥探到。这样可以增加神
随着信息科学技术的发展,Markov跳跃系统在当前的控制学科研究中扮演了重要的角色,其理论和应用方面的研究成果日益丰富。作为一类建模工具,Markov跳跃系统的状态演化由时间—事
我国的高分子工业在近年来得到了飞速的发展,作为高分子工业的必需过程,聚合反应的控制问题成为研究的热点。与连续生产过程相比,间歇与半间歇的聚合反应生产过程更能满足生产多
新年寄予新希望,新年开启新征程.为紧抓农商行改制后的发展机遇,有所侧重又富有成效地做好首季工作,实现全新经营模式下的突破精进与业绩腾飞,襄汾县联社不等不靠,提前着手,