主动地纠错式半监督聚类社区发现算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:hally123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经典的无监督聚类算法快速、简单且可以直接对大规模数据集进行划分,但是由于网络结构较为复杂,划分的准确度并不高。为此,提出一种基于主动学习的纠错式半监督社区发现算法ESCD(error correction semi-supervised community detection algorithm),将传统的K-means算法进行分步计算,并且在聚类的过程中加入成对约束。根据先验信息保留正确的划分,纠正错误的划分来改变网络的连接关系,使网络具有更明显的块结构,当节点与聚类中心的距离不再变化时划分结束。实验结果表明,与现有的社区发现算法相比,ESCD算法具有更高的精度,且所需的监督信息远远小于其他半监督算法。
其他文献
目的监测泌尿系疾病患者感染标本中大肠杆菌耐药状况,为临床用药提供参考。方法回顾性分析2003年1-12月泌尿外科住院患者感染标本中分离的32株大肠杆菌对常用抗生素耐药性的
<正> 软膏剂主要是发挥局部治疗作用的一种剂型,一般不要求透皮吸收而产生全身的治疗作用。但是由于皮肤病灶深浅不同,要求药物作用的部位也不同,因此,有的则要求药物透过表
本文分析指出翻译的三个要素是"语言信息""翻译者"和"翻译技术",并以三要素为线索,对翻译服务、本地化服务、语言技术与辅助工具开发、翻译培训与多语信息咨询进行共性分析,
计划生育的存废是近些年学术界的争论话题。生育因为涉及到人的权利,具有适度的敏感性。劳动力红利的经济学概念给我们展现了一个巨大的黑洞,人到哪里去了,经济发展怎么持续,
作为丝绸之路经济带的桥头堡、重要核心区和突破口,新疆不稳定、不发展,"一带一路"战略就无法落实,无法实现。该文从顶层规划、机制体制建设、信息产业战略三方面对新疆空间
"公共领域"这一源于西方特定历史背景的概念,在将它移植到中国的语境中时,需要结合具体的技术和制度差异进行考察。网络媒体在中国兴起之后,带来了交往方式的深刻改变。网络
基于聚类、最小方差、统计分析、列联表检验以及兴趣度的定义,提出一种水文时间序列关联规则挖掘模型。该模型中使用了基于聚类和最小方差的离散化方法、基于统计分析的规则
<正>王元骧是我国当代最活跃的文艺理论家之一。自1990年代以来,以他的文艺美学思想为研究对象的文章多了起来,重点阐述了他关于文学本质、文学观念和方法论的观点,这说明他
饲料的青贮发酵是一个复杂的微生物活动和生物化学变化过程,青贮过程中可加入多种青贮添加剂来调控青贮发酵。重点介绍了乳酸菌制剂、酶制剂和糖蜜在饲料青贮中的利用与研究,
税务代理是一种重要的金融服务中介服务,国外的发展已经比较成熟,但对我国企业而言却是新兴事物,它是市场经济发展的必然产物。随着我国企业对税务代理越来越多的接触和认识,