基于主动学习的高效社区挖掘算法

来源 :吉林大学 | 被引量 : 0次 | 上传用户:cl0916789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中,诸多复杂系统都可以由一个网络来进行抽象,如计算机邮件网络,生物学中的蛋白质网络,基因表达网络等。真实世界中的复杂网络普遍存在一些统计特征,例如“小世界网络特性”,“无标度特性”,“社区结构特性”等。其中社区结构的挖掘对于理解复杂网络的拓扑结构,分析复杂网络的功能,挖掘复杂网络隐藏的规律以及预测复杂网络未来的行为变化等都具有非常重要的理论意义和应用背景。近十年来,来自数学、物理学和统计物理学的研究者已经提出许多复杂网络社区挖掘方法。这些算法有传统的基于图划分的社区挖掘算法,有基于模块化质量函数优化的方法,动力学方法,还有基于统计推理的块模型方法等。其中块模型方法因为其能反映对复杂网络更基本的认识,并可用于挖掘多种社区结构正成为研究者们的研究热点。本文基于主动学习、块模型和吉布斯采样等方法,对社区挖掘问题进行研究,提出了相应的社区挖掘算法。本文的主要工作概况如下:(1)改进了一种基于随机块模型的主动学习策略下的网络社区挖掘方法,提出了新的高效方法。通过将原策略中吉布斯采样方法更改为贪心吉布斯采样方法,并通过按照各个局部极值的概率大小对原分布进行拟合,降低了计算开销,在保证社区分类正确性的前提下,很好的提升了算法的效率。(2)在以上工作的基础上,对主动学习策略进行了改进。原随机块模型通过对网络结点标签的主动学习来进行社区挖掘,而在许多真实网络中,更容易获得的知识是结点之间的边的标签:一条边链接的两个结点是否属于同一个社区。通过将原随机块模型中对网络结点标签的主动学习更改为对网络中边的主动学习,提高了算法的一般性,使得算法适用于更多的真实网络。(3)在人工合成网络和真实世界网络上对本文提出的算法进行了实验验证,并与原方法在准确性和计算效率上进行了对比分析。实验表明:本文提出的改进算法在保证较高网络社区挖掘准确率的前提下,大幅提高了算法的运行效率,计算时间远低于原随机块算法;本文提出的对边的主动学习策略,提高了算法的普适性,因而具有更好的算法实用性,适用于更多真实世界中网络。
其他文献
2015年中国网络视听大会上,《汉字英雄》经爱奇艺网站报送,被评为“十佳视频栏目”,成为全国唯一在本届大会上获奖的文化类节目,为我国传媒扩大传播力与影响力提供了有效路径,同时
中、英、日等发达国家的大学生创新创业教育已经形成了相当完善的体系。与之相比,中国的大学生创业教育在很多方面还存在着很多亟待改善的问题。在大众创新、万众创业的大形
高校学生党建作为党的建设的重要环节,应着力从思想建设、组织建设、作风建设等方面合力推进,以期最大限度地发挥基层学生党支部的战斗堡垒作用和学生党员的先锋模范作用。湖
通过文献资料法、专家访谈法和比较分析法对中、日、美、俄竞技体育后备人才培养的体制与机制研究,分析存在的问题和我国可借鉴的措施,为我国竞技体育后备人才的培养提出具有
新年伊始,中国特色大国外交迎来可喜开局:中美两国元首通话巩固中美关系健康稳定发展势头;法英两国领导人相继来访,北欧和波罗的海国家议会领导人首次集体访华,中欧合作再上新台阶
报纸
食品是人类赖以生存的物质基础,食品安全是一个遍及全球的公共卫生问题,不仅直接关系到人类健康,还严重影响着经济和社会发展。近几年,随着市场竞争不断加剧,我国的食品安全问题不断,很多食品生产企业在利益的驱动下,生产出危害身体健康的食品,甚至给人们的生命造成威胁;这一问题反映出我国食品生产行业的种种不足,是亟需解决的重大民生问题。食品质量管理是食品企业管理的重要组成部分,质量管理工作是一项综合性的科技管
<正>"英国脱欧"、特朗普上台、法国右翼政党崛起,当前,西方出现了一波反全球化浪潮。这一现象凸显世界经济增长乏力的背景下,西方发达国家内部矛盾加剧,并产生外溢效应。认识
针对当前我国城市建设中公共空间环境品质下降问题,本文采用案例总结的研究手法,以空间结构为研究视点对其进行交通组织的便捷性和空间类型多样性两个方面进行分析。总结提出了
随着能源短缺和环境污染加剧,两者严重地制约着人类社会的可持续发展,如何有效地解决这两大难题是目前人类面临的重要挑战。半导体纳米复合材料光催化技术就是在这样的背景下
近一段时间,从接待俄罗斯总理梅德韦杰夫访华,到举世瞩目的中美元首北京会晤;从习近平主席出席亚太经合组织第二十五次领导人非正式会议并对越南、老挝进行国事访问,到中国国家元
报纸