基于模块度的模糊聚类算法研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:zhangqi789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模块度可用于检测社区网络结构的强度,取值越大表明划分后同一社区内部关系越紧密,不同社区之间的关系越疏离,该特点与聚类的目标不谋而合。因此,近年来愈来愈多的聚类算法基于模块度进行设计,并取得了较好的聚类效果。然而,这些算法多属于硬聚类的范畴,受限于隶属度只能取0和1二值,聚类的准确率仍可进一步提高。此外,聚类分析过程结束后,聚类有效性检验是一个关键环节,常以有效性指标的取值衡量聚类算法性能以及准确率方面的优劣,已提出的有效性指标或判断结果不够准确,或鲁棒性较差。针对以上问题,本文基于模块度对模糊聚类算法展开研究,研究内容包括:(1)为了提高聚类算法的准确度,提出一种基于模块度最大化的模糊联合聚类算法MMFCC(Modularity Maximization based Fuzzy Co-Clustering)。该算法将模糊聚类思想应用于硬联合聚类算法CoClus(Co-Clustering)中,交替迭代计算对象和属性两个模糊隶属度矩阵,直至模块度值增大到稳定状态,产生最优的聚类结果,并以对角矩阵块的方式显示结果簇。本文使用稀疏真实数据集进行实验,从实验结果可看出,与其他对角联合聚类算法和不使用模块度的模糊联合聚类算法相比,MMFCC既提高了聚类精度,又用更直观、清晰的方式体现联合簇的意义。(2)为了验证模糊聚类算法聚类结果的准确性,融合二分模块度的思想,提出一种结合类内紧致性和类间分离性的模糊聚类有效性指标CSBM(Compactness Separateness Bipartite Modularity)。二分模块度的应用使该指标避免陷入局部最优问题,类内紧致性和类间分离性的引入有助于增强该指标评估聚类结果的鲁棒性,且在评判聚类结果数目时,该指标可改善对比指标随簇数目增加而出现的线性趋势问题。本文用模糊聚类算法在6个真实数据集上进行实验,结果表明,CSBM指标无论是在判断结果的准确性方面还是鲁棒性方面均优于其它6种常用模糊聚类有效性指标。
其他文献
随着我国人口老龄化趋势的逐年加剧,老年人的社会服务资源紧缺问题日益突出,特别是对于行动不便的老年人群。目前我国老年人的长期护理方式主要是以家庭成员或雇佣保姆等护理
近年来,大型跨国公司的税收激进行为日益突出,企业避税问题成为监管部门重点监督防范的问题。与此同时,会计师事务所在其中扮演的角色也越来越受到关注。2013年,英国下议院会计公共委员会质疑四大会计师事务所利用法律漏洞帮助跨国公司避税。据英国媒体调查报道,很多跨国企业在会计师事务所的帮助下,使用转移定价等方式进行避税。学术界以往的研究讨论了公司避税的手段、影响因素及经济后果等方面,鲜有文献关注审计师在企
随着工业4.0和智能制造2025等概念的提出和实施,自动导引车(Automated Guided Vehicle,AGV)在自动化工厂、智能化物流系统等领域得到了广泛的应用。AGV的大量应用提高了相关
在非交换射影代数几何的研究中,需要将一个诺特分次代数的商范畴用其它代数的商范畴来刻画.在非交换奇点解消理论中,需要将Gorenstein代数的商范畴用某个自反模的自同态代数
当前,我国机器人市场进入高速增长期,工业机器人连续五年成为全球第一大应用市场。然而工业机器人在使用中存在能量的不合理利用,造成大量的能源浪费,其能耗问题已上升到国家
麦盖提斜坡在其形成演化过程中经历了多期构造运动,构造应力场多次发生改变,从而发育多期次活动的断裂构造,成为斜坡带的一个显著特征。麦盖提斜坡不同期次断裂构造的构造变
蛋白质是生物体实现生命活动的基础,单一的蛋白质难以实现生物体丰富多彩的生命活动,它们通过彼此相互作用并形成蛋白质复合物来实现特定的生物功能。因此在结构复杂、数据规模较大的蛋白质相互作用网络中,精准且高效的识别出蛋白质复合物对理解蛋白质相互作用网络的结构、分析细胞实现生命活动的过程以及生物医学的研究均有重要的意义。在现有的研究中识别蛋白质复合物主要分为实验方法和计算方法,一般采用实验方法花费的时间比
网络信息系统的快速发展和广泛普及,有效提升了网络中信息流动的速度,使得网络信息的传递和交互变得极为频繁。而且近年来,智能移动设备市场占用率的增高使得人们将会更加便捷地获取网络信息,极大方便了个人生活。然而,由于利益的驱使,信息系统中的漏洞和监管措施的不完善使得网络信息安全问题频发。随着用户数量的不断变化和用户属性的不断增多,导致信息系统对用户管控变得越来越麻烦,传统的访问控制技术很难对用户的访问请
随着经济的发展,科学技术水平的提高,农业生产已经不再局限于靠天吃饭,农业生产方面运用科学技术,不仅可以提高农产品产量,还能增加利润收益。科学技术水平的应用在当下越来
同步定位和地图构建(SLAM)是机器人在行进过程中,通过传感器获取环境数据来建立环境地图并同时估计出自身位姿的过程。随着移动机器人应用领域的增多以及应用场景的复杂化,部分未知的半结构化环境以及完全未知的非结构化环境下的移动机器人定位成为迫切需要,SLAM成为解决移动机器人自主导航的关键技术。本文主要分析了基于深度传感器的视觉SLAM实现方法,包括鲁棒的图像特征点检测和匹配、机器人运动的相机位姿估计