层次凝聚和主动学习半监督社团检测算法研究

来源 :兰州大学 | 被引量 : 0次 | 上传用户:mxyyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,复杂网络研究作为一个新兴的研究方向,已经成为了计算机科学、统计物理学、社会学、生物信息学等领域的一个热点问题。复杂网络具有小世界性、无尺度性、模块性等特性。通常,一个复杂网络包含有若干个社团,同一个社团内的节点联系紧密,不同社团间的节点联系疏松。发现复杂网络的社团结构是理解和分析复杂网络的一种重要工具和手段。有效的社团检测算法,可以划分出清晰的社团结构,降低复杂网络的研究难度。发现复杂网络的社团结构是复杂网络研究中的一个重要课题,具有重要的应用价值。本文通过对现有社团检测方法的研究分析,提出了两个新的社团检测算法CDACSM和ASCD。CDACSM算法是基于相似度度量的层次凝聚社团检测算法,该算法主要解决层次凝聚社团检测算法存在的两个问题:1)容易产生极小和极大社团;2)一旦节点的标签被划分错误,直到社团检测结束都是错误状态,无法更正。CDACSM算法通过定义单点社团间的相似度、社团间的相似度等度量标准和单点社团和社团间的合并规则等,在一定程度上有效地避免了以上两个问题。ASCD算法是基于主动学习的半监督社团检测算法,该算法的设计主要针对以下三种社团划分结果不清晰的情况:1)半监督学习的标签数据质量不理想时;2)网络结构比较复杂和模糊时;3)社团规模大小相当时。ASCD算法定义了相关度、最相关节点、凝聚力等度量标准,提出了标签数据的主动选取方法和利用这些标签数据进行半监督学习的策略,在以上三种情况下获得了较好的社团检测效果。本文利用多个真实的复杂网络数据集和评判基准图数据集对CDACSM算法和ASCD算法进行了实验验证。通过模块度、准确率、运行时间效率等多项指标对CDACSM算法和ASCD算法进行评价,实验结果表明本文提出的两种社团检测算法具有较好的社团检测效果且运行效率较高。
其他文献
大脑是生命活动的高级指挥中枢,大脑内部神经元之间的同步作用形成了结构和功能上非常复杂的脑神经网络。将复杂网络稳定性理论应用于脑神经科学领域,从网络的角度探究大脑的
众所周知,自数论发展以来,各国数学家就一直热衷于素数与素数函数的研究与探索,并得到了很多具有重要意义的结论。美籍罗马尼亚数学家Florentin Smarandeche教授在他的一本著
研究背景复发性流产(Recurrent spontaneous abortion,RSA)的定义为两次及两次以上的宫内妊娠后发生的胎儿丢失。其病因复杂且缺乏特异性的临床表现。并且,约有50%的复发性流
二维碳纳米片(CNS)作为碳基体材料,其厚度小、碳源丰富、具有良好的导电性,可控的杂原子掺杂,在超级电容器等储能器件应用方面成为最具有前途的材料之一。但其仍然具有碳材料固
随着社会经济发展,能源尤其电能需求越来越大,电网全面推广基于科技创新降低资源消耗、减少环境污染的模块化建设模式,而预制舱式二次组合设备能满足电网中500kV及以上电压等
全息术的发展大致经历了1948年英国科学家丹尼斯盖伯提出的传统的光学全息、1965年的计算机全息以及随后的数字全息三个阶段。传统的光学全息是拍摄三维世界中的物体的全息图
一个分数阶微分方程是含有分数阶导数的方程;一个分数次积分方程是含有分数次积分的积分方程.一个分数阶系统是指由分数阶微分方程或分数次积分方程或由该方程组描述的系统.我
近年来,随着我国全面建成小康社会,迈入全面建设现代化国家的新征程,建设一个更加开放的、内外两个循环都顺畅的大背景下,加强与周边国家的开放合作越发重要。重铸南方丝绸之路的辉煌,推动“孟中印缅经济走廊”发展是必不可少的途径。本课题拟对孟中印缅科技合作进行演化博弈分析,以期对走廊建设提供一定的理论参考。首先,从孟中印缅4国延伸到南亚东南亚19国的科技知识获取评价体系,用熵值法分别计算各级指标的分值与排名
近年来电力行业迅猛发展,使得大气污染问题日益严峻,因此采用CEMS系统对电厂排放的烟气进行监测,以满足污染物排放要求。在NOx检测过程中,NOx中的NO2先通过NOx转化炉催化转化
高超声速飞行器因其在速度方面的绝对优势,在民用运输以及国防军事方面有着重要的战略地位,世界各国都十分重视高超声速飞行技术,其中减阻和热防护一直是飞行器发展要解决的