基于层次分析法的聚类集成研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:good240
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为数据划分的方法之一,聚类分析在处理高维甚至大规模的数据方面具有强大的生命力。聚类能发现有价值的数据分布和数据模式,目前广泛应用于社会多个领域。由于数据集属性的多样性,以及数据内部结构的多样性,任何单一的聚类算法都不能适应于所有类型的数据。受到分类集成技术成功应用的启发,聚类集成技术成为研究热点。当前的研究表明,聚类集成可以有效地提高聚类算法的性能,弥补单一算法的不足。虽然目前国内外产生了许多的聚类集成算法,不乏成功的集成算法,但是从这个领域的应用上来说,这方面的研究工作还处于发展阶段,需要深入研究。本文在前人研究的基础上,主要研究聚类成员共识函数的设计问题,旨在推进聚类集成理论与应用的研究工作,取得了一些富有价值的成果。   本篇论文探讨了对于一个指标,其指标内所有值的取值在一个较小区间范围内,如何衡量指标内单个值的重要性,本文提出了基于层次分析法的权重求解新度量。文中定义了自适应判断矩阵的概念并利用传统方法求解得到自适应权重,也证明了自适应的判断矩阵满足一致性检验。构造出的判断矩阵有效避免了基于原有层次分析法指标构造判断矩阵的主观性,并将其求解方法应用于共识函数设计。此外,本文针对目前大多将聚类成员同等看待即简单投票的方法获得最终的聚类结果,没有考虑聚类成员的重要性程度,本文提出基于层次分析法的加权聚类集成。利用基于层次分析法的新度量构造自适应判断矩阵,求出不同聚类成员的自适应权重,最后构造一致隶属度矩阵基于投票得出最终聚类结果。   本文的内容如下:   第一、介绍了聚类集成的研究背景、国内外的研究现状。   第二、简单介绍了聚类的概念、当前已有的聚类算法以及评价聚类质量的指标;另外,分析聚类集成产生的原因、描述聚类集员之间差异性的度量以及介绍了主要的聚类集成算法。   第三、详细给出了基于层次分析法的自适应权值生成方法,论文首先介绍了层次分析理论,包括层次分析框架、不同的标度和具体求各因素重要性排序的方法。其次,通过一个问题,构造自适应标度,给出相关定理、性质并检验其满足一致性。   第四、提出基于层次分析法的加权聚类集成,论文首先介绍了基于加权聚类集成的研究现状,其次重点介绍了基于层次分析法的加权聚类集成算法的思想与步骤,最后从验证共识函数设计的有效性、集成规模对算法的影响以及与其他的集成算法比较三个角度对算法进行验证,以UCI数据库中的真实数据集进行实验,验证了基于层次分析法的加权聚类集成算法是一个聚类正确率较高,稳定性较好的聚类集成算法。
其他文献
本文以一个二维分数阶逆热传导问题为模型展开研究,这是一类严重不适定问题,它的理论分析和数值计算较一维情形更加困难.本文我们用四种正则化方法来恢复解的稳定性,它们分别
案例教学是高职院校思想政治课常用的一种教学方法.思想政治课教师精心选取教学案例、有效组织案例教学,及时评析教学效果,通过对具体案例的分析、解读,凸显思想政治课教学的
在葛洲坝电站十多年的运行经验的基础上,根据三峡——葛洲坝水电站的梯级特点,该文对三峡——葛洲坝的水能规划和日优化运行以及三峡——葛洲坝水库长期优化调度等作了系统研
本文首先综述了Elkies关于K=k(t)=F22n(t)上特殊椭圆曲线Mordell-Weil格的系列文章[6-8]。研究定义在有理函数域k(t)上的一类椭圆曲线E:y2+y=x3+tq+1+a6,q=2n,a6∈k是一个调节
在Google,Yahoo以及MSN等这些搜索引擎公司的关键词拍卖中,参与竞价的广告客户究竟如何选择他们的出价策略是一个十分值得思考的问题。在众多的关键词拍卖机制中广义第二价格拍
在本文中我们考虑了在随机扰动下,一类具有阻尼的线性耦合振子系统的锁频现象。我们证明了存在一个不变分布π,当系统以π为初始分布时,对于任意强度的随机扰动和任意大小的驱动
多年的一线语文教学,让我深感习作教学实属一个难见成效的内容。面对每一次的习作练习,教师即便有精心的课前准备,然而在与学生的交流互动、耐心指导之后,一些学生写出的文字
在这篇硕士论文中,我们分别考虑了带有加性噪声的随机强阻尼Plate方程及带有高斯白噪声的随机Plate方程解的长期性态.  第一章,给出了全文要用到的基本概念和一些抽象结论.
自中国沪深股市建立以来,有关其有效性,尤其是弱式有效性的研究便从未中断。市场是否有效,有效程度高低及其发展趋势,对于普通投资者、金融机构和政府监管部门,均具有重要的意义。
磁流体动力学主要是研究等离子体和磁场的相互作用等问题,磁流体力学主要用来研究解决的有:理想导电流体运动对磁场影响的问题;或流体静止时,流体电阻对磁场影响的问题,其中包括