二分网络社区挖掘的研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:zzw200512168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然界与人类社会活动中,各种复杂类型的系统都可以转化成相应的复杂网络,比如经济系统、生物系统、群体生态系统以及其他领域内系统。复杂网络分析领域的一个重要研究方向是社区结构及其社区挖掘。一个复杂网络的社区结构大致可描述为:在这个社区内部里,顶点连接比较紧密,而这个社区连接外部社区的联系是比较稀疏的。在结构上,一个社区往往是相对独立的,通常它们各自对应一些基本的功能单元。例如,在生物基因遗传网络中,一个社区往往包含具有类似功能的基因模块;在万维网中,一个社区对应着相同类型主题或者资源的网页。从复杂的网络中挖掘和分析这样的社区结构,为复杂网络的功能解析和揭示网络的组织原则提供了一种创新的研究方法。相对于单分网络,二分网络不仅是复杂网络中重要的表现形式之一,而且在现实社会复杂网络中具有普遍性,已经成为复杂网络的重要研究对象。在现实社会中,许多复杂网络都自然地呈现出二分结构。譬如:作者与文章的合作网络、演员与影视作品的合作网络、投资者与股份制公司的股份合作网络、疾病与基因的作用网络、俱乐部成员与俱乐部举办活动的参与网络、观众与歌曲的喜好网络、P2P系统中终端计算与交互数据的网络等。因此,二分网络社区挖掘对于研究复杂网络有非常重要的理论意义和实用价值。譬如,在学术圈的探测、功能分析、推荐系统、疾病诊断以及链接预测等方面都有很多重要的应用。在最近的二分网络社区挖掘研究中,学者们提出了许多的社区挖掘算法和二分模块度指标。为了评估网络社区挖掘结果的质量,Newman介绍了一种量化的方法,称为模块度。Guimera等人提出了一种基于同质顶点共同邻居的二分模块度,只针对一种类型的顶点划分的社区。Barber拓展了Newman的单分网络的模块度,提出了异质社区间一一对应的二分模块度,同时提出了adaptive BRIM算法用来社区挖掘通过最大化获得二分模块度。Murata基于Newman的单分网络模块度提出了异质社区间一对多关系的二分模块度,对于单分网络,该模块度和Newman的单分网络模块度一致。Suzuki和Liu Xin等人基于异质社区间多关系对应分别提出了两种不同的二分模块度。Raghavan等人介绍了一种标号传播算法用于社区挖掘。Murata还对标签传播算法(LPA)做了改进,提出一种更加适合二分网络的算法。同时,Murata等人提出了LP&RRIM算法,该算法是对BRIM算法和LPA算法的整合和改进。针对二分网络社区挖掘的研究,本文中的主要工作以及研究成果有:(1)我们提出了基于蚁群优化的二分网络社区挖掘算法。首先,我们先将二分网络社区挖掘问题转化成二分网络顶点组合优化问题。其次,我们以蚁群优化算法为基础,结合二分网络的统计特性,重新定义了信息素和启发式信息,设计了新颖的蚂蚁觅食的社区划分模型。最后,我们选择适当的二分模块度衡量社区划分的质量。通过实验验证发现,我们的算法不仅准确地识别二分网络的社区个数,还可以获得很好的划分效果。该算法的另一个优点是它不需要预先制定社区的个数,而是在优化过程中形成最优的个数。(2)针对二分网络中多关系社区的挖掘问题,我们提出了一种多关系社区的二分网络社区挖掘算法。该算法以异质社区之间多对多对应关系为基础,以同类型顶点的共同邻居数作为启发式信息。该启发式信息表示同类型顶点的相似程度,以多关系异质社区的二分模块度为量化标准,结合蚁群优化策略进行二分网络社区挖掘,对二分网络进行多关系异质社区划分。通过实验验证发现,我们的算法能较准确地对实际二分网络进行多关系异质社区划分。(3)针对现有二分网络的模块度的局限性,我们提出了一种基于密度的二分模块度,用来量化二分网络社区结构划分的质量。在二分网络中,学者们根据对二分网络社区定义的不同理解,提出了多种二分模块度。然而,这些二分模块度往往取决于网络社区中连接的数量而忽略二分网络中顶点的数量,无法识别规模较小的社区结构,存在一定的局限性。我们通过几个数据集以及理论上和数学公式的逻辑证明,我们提出的基于密度的二分网络模块度不存在类似的局限性,还可以作为目标函数进行优化,也可归结为一个数值的非线性规划问题。通过实验验证发现,基于密度的二分模块度是非常可靠的和准确的。
其他文献
螺旋式油气分离器是一种常用的井下油气分离器,由螺旋片、中心管、分离筒、排气阀以及桥式连接筒等组成,其利用离心分离以及紊流化可以使气泡聚合,然后借助套管截面积来最大限度
自2015年5月,央行再次宣布降息后,各大商业银行纷纷采取措施提高自己的浮动利率,以提高银行的财务绩效。单从外部措施提高是不够的,本文结合商业银行董事会治理的特征及相关理论,
随着计算机信息化和人工智能的发展迅速,专家自动诊断疾病系统成为各界关注的焦点。卵巢癌是严重威胁妇女健康的恶性肿瘤之一,而且目前无有效的筛选方法和特异的诊断方法。BP
《战时妇女》是陕西新生活运动委员会妇女工作委员会的会刊.是抗战时期陕西乃至西北大后方.一本影响力较大的妇女刊物.其在向陕西乃至广大西北妇女宣传抗日救亡运动及妇女解放运
多年的历史教育教学实践使我认识到教育创新的重要性。而在初中教育教学活动中,课堂教学活动的创新显得尤为重要。但创新的前提是“充分发挥教师的主导作用,重视学生在课堂活
本文通过分析彭州市蔬菜批发市场的现状及存在的问题,提出彭州蔬菜批发市场发展需要促进蔬菜市场主体组织化、规模化,实施蔬菜质量分级和农药残留检测制度,提高蔬菜批发市场
针对经典Mean—Shift算法要求相邻两帧间目标模板区域必须重叠的缺陷,结合Kalman滤波器,提出了改进算法。算法首先将Kalman滤波器预测的目标位置作为Mean—Shift算法中的初始搜
以辽东山区次生林4 hm~2动态监测样地为平台,2014—2016年连续3年对样地进行乔木优势树种幼苗调查和半球面影像拍摄,分析森林更新过程中林下乔木幼苗和冠层结构的动态,研究幼
我国作为一个正处于发展中的大国,人口数量在不断的增加,相应对于能源的需求也变得越来越多,这在某一种程度上说明现阶段的社会和经济都在依赖着能源才会进步和发展。但是能
目的探析对直肠癌患者围术期应用快速康复外科新理念对术后护理的临床价值。方法取本院2016年3月至2018年12月收治外科手术治疗直肠癌患者相关数据进行分析,有50例,根据患者