基于属性和关系的聚类算法研究

来源 :山东建筑大学 | 被引量 : 0次 | 上传用户:Mike_sun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交网络、生物网络等社会网络的兴起,对社会网络的研究引起了人们越来越多的关注。通常情况下,社会网络一般被抽象成图,图中的节点表示被研究的对象,图中的边代表对象之间的关系。我们可以通过研究这些图而找到隐藏的信息,便于人们理解社会网络的结构和功能。随着社会网络资源的逐渐丰富,我们对社会网络的探知已经不能局限于只使用对象的属性信息或者是对象之间的关系信息,同时利用对象的属性和对象之间的关系信息是非常必要的。目前,多数聚类算法在分析社会网络图时要么只关注节点的属性,要么只关注节点之间的关系,只有少部分算法同时利用节点的属性和节点之间的关系进行聚类,例如SNAP算法。虽然这些算法也能较好的划分社会网络,但还存在一定的局限性。目前传统的聚类算法大致可以分为四类:层次化聚类算法、划分式聚类算法、基于密度和网格的聚类算法和其它算法。因为划分式聚类算法具有思想简单、效率高等优点,并且在处理大型数据集时还具有一定的伸缩性,而且这类算法应用比较广泛,所以本论文主要在划分式聚类算法的基础上开展研究。SNAP算法提出以后,人们也对SNAP算法做了一定的改进,如K-SNAP算法。虽然这些算法能把对象的属性和对象之间的关系很好的联系在一块,但是也各有不足之处,如SNAP算法在按照属性划分的初始阶段,如果属性值的取值范围很大,那么初始划分的时候将分成很多的小分组,而这显然不是有效率的社区划分方法。本文在学习总结了一些经典的聚类算法的基础上,分别按照对象的属性初始划分、按照对象之间关系再次划分来改善K-SNAP算法存在的问题。在本文中,首先借助CANAL的思想,对数值型属性进行了预处理,以减少无用分组的数目。然后引入Q函数理论,在根据对象之间的关系进行划分时,将分组中节点之间的联系密度作为一个衡量标准,使得分组更有实际意义。最后我们使用了一个实际数据集,做了一系列实验,实验结果验证了我们所提出方法的有效性。
其他文献
区域活动丰富了幼儿的生活经验,尊重了幼儿的个体差异,满足了幼儿的好奇心,是幼儿最喜爱的活动之一,是幼儿自主学习的主要场所和幼儿自我意识形成的源泉。在宽松、愉悦的学习
期刊
蛋形断面有三种形式,即Ⅰ、Ⅱ、Ⅲ、Ⅳ型四圆弧蛋形断面、上、下椭圆蛋形断面和六圆弧蛋形断面。蛋形断面由于几何形状复杂,使得水力参数和水力计算均比较复杂,其中,水力参数包括
构造技术是建筑学专业的重要基础和支撑.建筑设计不仅要解决空间组合、立面造型和观感等问题,更重要的是重视建筑生态环境、人与自然和谐共生这样一个以人为本的设计理念,尤
地震易损性可定义为在某一特定地震强度作用下,结构发生破坏的概率,通过对结构进行地震易损性分析可获得在不同等级地震作用下的结构失效概率。因此,基于地震易损性分析的结
随着视频应用的深入,具有更好压缩能力和更多特性的视频编码标准不断出现。但是由于旧的播放设备无法及时更新,会造成为了兼容现有设备而继续使用早期编码标准,造成新的视频
为了研究矩形螺旋箍筋混凝土梁在纯扭作用下的受力性能,以箍筋间距、箍筋绕制形式以及混凝土强度等级为主要参数,按L9(34)正交表确定了试件的数量,设计并制作了9根矩形螺旋箍
中国许多旧城都具有非常悠久的历史和别具一格的城市特色.如何保持、延续和发展这些特色,使旧城在更新改造的过程中充满生机和活力,一直是值得关注的课题.国内外旧城更新的历
单索面斜拉桥具有行车视野开阔,简洁优美的优点。布置在行车道中央的桥塔与直接锚固在梁中线的拉索使材料用量较省。对于拉索疲劳问题,采用单索面布置是有利的。基于以上优点,单
“常州三杰”精神是宝贵的中华民族精神,其所包含的爱国主义、艰苦奋斗、实事求是、开拓创新等精神,对于新时代的大学生来说具有重要的学习意义,也是高校思想政治教育中举足
目前关于人工湿地的研究中,系统内部净化过程仍未完全明了,尤其是关于微生物净化机理的研究较少。本课题在进行潜流式人工湿地污染物去除主要影响因素及运行参数研究的同时,研究