属性全局相似度在聚类算法中的实现与应用

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:gaoyaoyang22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘领域最重要的研究分支之一,也是数据挖掘领域最为常见和最有潜力的发展方向之一,它的目的是根据某种相似度度量对数据集进行划分。目前,针对数值数据的聚类方法已经得到了专家学者们的深入研究,但针对数值数据的聚类方法并不适用于聚类现实世界中广泛存在的分类数据。因此,对于分类数据聚类算法的研究与改进,是聚类分析领域一个重要的研究方向。论文详细介绍了聚类分析的概念及聚类分析中常用的数据结构、相似度量、目标函数。在分析了K-Modes算法的优缺点后,论文提出了用于分类数据聚类的属性全局相似度,并将其应用在分类数据聚类中和图聚类中。(1)提出了一种基于属性全局相似度的分类数据聚类算法—KBGRS算法。通过对K-Modes算法的分析发现,K-Modes算法的简单匹配相异度忽略了数据对象各属性之间的关系,而这会降低算法的聚类精度。基于此,KBGRS算法提出了属性全局相似度,该相似度综合考虑了数据对象与各聚类中心之间的关系以及不同属性之间的差异性。KBGRS算法使用K-Modes算法框架完成聚类。理论分析表明,KBGRS算法的中心点和隶属度更新策略不仅可以使得算法目标函数最小化而且可以使得算法在有限次内迭代完成。通过实验分析表明,KBGRS算法可以有效地对分类数据进行聚类。(2)提出了一种基于引力相似度的图聚类算法—AF-Cluster算法。通过分析发现,传统图聚类算法只关注于图的拓扑结构或节点特征中的一个,而很少有算法将两者结合起来。为了能有效地对节点包含分类属性的无向图进行聚类,AF-Cluster算法提出了直接引力和间接引力两个概念,并定义了节点间的结构相似度。AF-Cluster算法使用属性全局相似度作为节点间的属性相似度,然后采用结构相似度和属性相似度协同策略定义节点间的引力相似度。AF-Cluster算法使用K-Medoids算法框架进行聚类。理论和实验分析表明,AF-Cluster算法可以收敛完成并且具有很好的聚类效果。
其他文献
跨模态多媒体检索是信息检索的一个重要研究领域。随着大数据时代的到来,不同模态数据呈爆炸性增长,基于单模态数据的检索已经不能满足人们的需要,跨模态多媒体检索技术应运
为创制马铃薯野生种与栽培种远缘杂交后代,本研究采取“嫁接当代、母本无性系、累积嫁接Ⅰ、累积嫁接Ⅱ、父母本无性系”5种嫁接方式,通过统计嫁接株和对照组座果率及结实率,开展嫁接对马铃薯冀张薯8号、冀张薯12号与二倍体野生材料种间杂交亲和性影响的研究,以期筛选出最佳的嫁接方式及亲和性强的杂交组合,获得远缘杂交种子,为马铃薯育种提供新的中间材料。试验进一步运用石蜡切片技术观察冀张薯8号、冀张薯12号与二倍
从Egocentric视频摘要中检测和识别不同的对象是计算机视觉的一项重要技能,它利用在图像和数字视频中对特定语义类的检测实例来进行动物识别,并生成一段简短而有意义的视频,
为使得DP曲线具有形状调节的功能,提出带2个形状参数的三次DP曲线。首先将一类三次DP基函数进行了推广,给出带2个形状参数的广义三次DP基函数;然后基于该基函数定义带形状参
SCBA全国体育院校篮球联赛的前身是全国体育学院篮球锦标赛,于2016年由过去的四年一届改革为现在的一年一届。全国体育院校篮球联赛的改革,促进了体育院校篮球人才的培养,不
为了标准化实验室内半刚性基层试件的压实过程,使其在实验室内就能模拟现场振动压路机的真实碾压工况,本文设计一种新的振动压实成型机。目前,市场上振动成型机种类复杂,参照
随着移动互联网的飞速发展和无线网络的不断普及,手机已经成为人们生活中的一部分。目前手机系统以IOS和Android为主,其中Android系统因其开源、开发方便、免费等特性深受广
近年来,随着我国高速公路建设规模的扩大,公路隧道数量急剧增长。受地形及占地等因素的影响,连拱隧道的建设越来越受到人们的重视。早期修建的连拱隧道大多以整体式中墙连拱隧道为主,随着运营时间的延长,整体式中墙连拱隧道暴露出严重的病害问题。随后,复合式中墙连拱隧道逐步被应用到连拱隧道的设计与施工中。相比于整体式中墙连拱隧道,复合式中墙连拱隧道运营过程中的工作状态整体表现相对较好。由于该隧道形式出现的时间相
厌氧氨氧化(anaerobic ammonium oxidation,简称ANAMMOX)生物脱氮工艺因其具有节约氧耗、污泥产量低、基质去除速率高等显著优点,使其成为了国内外学者的研究热点。但活性污
21世纪以来,我国国民经济飞速发展,大宗货物运输量的急剧增加,对铁路货运能力提出了越来越高的要求。因此,开展重载铁路运输成为了现今铁路货运发展的必然道路。在开展铁路重载运输的过程中,出现了许多问题,货车运行平稳性就是其中非常重要的一个课题。运行平稳性主要包括横向平稳性、垂向平稳性。本文主要以纵向力作用对重载车辆运行平稳性的影响为研究对象开展相关工作。本论文对某重载线路实测纵向车钩力实验数据进行收集