基于图神经网络的自监督社区检测算法研究

来源 :军事科学院 | 被引量 : 0次 | 上传用户:g123s123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图数据作为非欧几里得结构数据的典型代表,能够很好地反映现实世界的抽象。图数据的相关研究已成为近年来的热门领域,例如链接预测、多跳推理和社区检测等任务已广泛应用于现实场景。其中社区检测任务作为图数据分析的典型应用,旨在从复杂的图结构网络中挖掘节点和边之间的隐藏关系,例如在社交网络中寻找具有相似爱好的人群或是在军事知识图谱中划分具有相似属性的军事要素。但是,由于图数据的表示形式愈趋复杂以及数据规模愈趋庞大,传统的社区检测算法在性能和效率上都有所不足。受深度学习在计算机视觉和自然语言处理领域成功应用的启发,学者们致力于将深度学习与图表示学习相结合,进而提出了图神经网络(GNNs)。图神经网络具有强大的图表示学习能力,其已经在社区检测等图数据分析任务上取得优越的性能,但目前仍存在一些不足:1)由于构建图数据的复杂性,部分图数据缺乏足够的被标记数据,这使得图神经网络只能使用少部分标记数据而忽略了大部分未标记数据。2)大部分图神经网络只从单一视角学习图数据,未考虑图数据的局部和全局信息。尤其是在社区检测任务中,社区中的节点和社区的整体分布都扮演了重要角色。3)当前部分图神经网络对以社区检测为导向的目标函数缺乏合理性解释。在无监督场景下缺乏标记数据,使得图神经网络的目标函数与社区检测无关。为解决上述问题,本文分别针对半监督场景和无监督场景下的社区检测设计了新型的图神经网络模型。具体来说,在半监督场景下,提出了一种新型的端对端的迭代特征聚类图卷积网络(IFC-GCN)。IFC-GCN利用迭代特征聚类(IFC)模块增强了经典图卷积网络(GCN)的图表示学习能力。在IFC模块中,利用GCN预训练得到的伪标签和对节点隐藏层特征聚类得到的聚类标签构造判别矩阵,通过判别矩阵可以识别节点对之间的相似关系,然后构造优化模型对节点向量表示进行迭代地优化。除此之外,为IFC-GCN设计了一种类似最大期望(EM-like)的模型训练框架,在该训练框架中通过交替校正伪标签和节点向量表示来进一步提高图网络模型的性能。在无监督场景下,提出了一种基于多粒度特征交互的对比学习框架(CL-MGI)。在CL-MGI中,首先引入对比学习损失函数Info NCE,并理论分析其对社区检测任务的适用性。然后,分别从节点级和图级角度构造两个独立的对比学习模块。节点级模块学习细粒度的节点特征信息,图级模块学习粗粒度的社区分布信息。同时,在节点级模块中提出了一种整合图拓扑信息和节点特征信息的自适应特征融合方法来选择对比样本对。该方法可以选择无偏的正负样本对进而防止节点特征的局部过度拟合。更进一步,引入基于时序熵的度量指标来评估样本质量,并以协同训练的方式实现节点级模块和图级模块的信息交互,进而实现多粒度特征信息的融合。本文针对半监督场景和无监督场景设计的图神经网络模型本质上都属于自监督学习的算法,它们充分利用数据自身的信息来学习良好的节点表征。在半监督场景和无监督场景的公开数据集下都进行了充分实验,实验结果表明本文所提出的方法无论是在社区检测任务的准确率还是模型泛化性上都具有优越的性能。
其他文献
DNA的碱基序列具有丰富的结构和功能信息,通过合理的序列设计可以用来精确地构建二维和三维的宏观产物。通过DNA交联而形成的DNA水凝胶具备了生物相容性,稳定性以及可调的生物多功能性等优点,在生物传感和生物医学方面引起了越来越多的研究兴趣。其中,刺激响应性DNA水凝胶也称为智能DNA水凝胶在不同的触发因素下,能够发生凝胶到溶胶之间的可逆、可切换的转变,从而作为用于生物传感的智能材料,引起了研究者们的
学位
脑出血后的神经损伤涉及多种病理过程及机制。近年来研究发现,脑出血后血肿周围组织出现细胞焦亡(pyroptosis),而抑制细胞焦亡能减轻神经损伤,对脑组织起保护作用。因此,细胞焦亡可能是脑出血的潜在干预靶点。进一步研究细胞焦亡在脑出血患者神经修复中的作用,可以为脑出血的治疗提供新的思路。本文就细胞焦亡在脑出血中的研究进展进行综述,旨在为相关领域的研究提供参考。
期刊
非酒精性脂肪肝(Nonalcoholic Fatty liver Disease,NAFLD)是一种除酒精外的、与胰岛素抵抗和遗传易感密切相关的代谢应激性肝损伤,其病变主体在肝小叶,以弥漫性肝细胞大泡性脂肪变性和脂肪贮积为病理特征。近年来,NAFLD患病率不断上升,且发病年龄日趋年轻化。虽然NAFLD通常与肥胖相关,但非肥胖患者也可能患有非酒精性脂肪性肝病。在NAFLD患者中,大约40%左右是属于
学位
历史活动课的设置是我国新一轮课程改革的重要举措,丰富了课程类型与结构。但在应试教育背景下如何研究好、开展好历史活动课,使其与常规课发挥协同育人效应,是探究高中历史教学的重要途经。基于此,文本主体分为以下三个部分。第一部分:梳理活动课的发展历程及基本内涵,厘清历史活动课与历史常规课之间的关系,说明历史活动课的种类,说明历史活动课的编写依据与原则,主要特点以及设置目标。历史活动课的编写根植于历史学科的
学位
课题研究背景创伤失血是院前急救处置中最为棘手的环节,也是导致伤患死亡的最主要原因。失血控制的成功率将大大影响伤患的死亡率。现阶段常用的止血敷料包括高分子类和无机类。外军研究发现,无机止血材料的止血效率和环境适应性优于高分子材料,但沸石等无机类止血材料也存在一些体内残留、热致组织损伤等安全性问题。因此,院前紧急救治使用的止血剂除了止血性能优异,也要安全且易于去除。有研究曾报道了介孔沸石在棉纤维表面原
学位
<正>自古以来,大枣均被历代医家列为补身佳品。台大免疫博士孙安迪大力提倡平时多食大枣、黄芪,具有滋润脾胃提振元气,增强免疫力对抗疾病的功用。大枣不仅虚弱者宜服食,健康的人常食亦甚相宜,现今小朋友常食高热量、高脂肪、碳水化合物的垃圾食物。
期刊
<正>茶飨养人是有根据的。以茶入馔,不是现在才有,自古以来中国就有"茶食"的说法,原料里包含了茶的糕饼点心统统叫做"茶食",用茶做的菜叫"茗菜",加了茶的粥叫做"茗粥"。茶是君子,成"菜"之美,春天里来一道养人的茶菜,身体最欢喜。
期刊
以天然产物为先导化合物,进行结构修饰和类似物合成是新药发现的重要策略。姜黄素是从姜科植物姜黄根茎中分离得到的活性成分,具有抗氧化、抗炎、抑菌、抗肿瘤、神经保护、抗糖尿病、降血脂、心脏保护、胃肠道保护、辐射保护等生物活性和药理作用。姜黄素广泛的生物活性吸引了一大批研究者对其衍生物进行探索,1993年Toshiya Masuda等人从姜科植物Zingiber cassumunar中分离得到具有复杂结构
学位
目标跟踪作为计算机视觉领域中的基础研究内容之一,在智能视频监控、自动驾驶、智慧农业和智能交通等领域中被广泛应用。随着大规模公开标注的图像数据资源的出现与计算机硬件计算能力的进步和发展,优秀的目标跟踪方法不断涌现,其相关研究也取得了极大的进展。虽然目标跟踪技术在当前有着良好的发展环境和发展势头,也促进了许多其他计算机视觉任务的发展,但是由于实际应用场景的多样性,跟踪环境和目标自身运动规律的复杂多变,
学位
雾天情况下的目标检测任务如人脸识别、无人驾驶、车牌识别等,其性能因目标被不同程度遮挡而受到严重影响。为了解决雾天目标检测任务中目标特征表达不足的问题,需要联合图像去雾算法来降低检测任务中目标提取难度,增强检测模型对不同程度雾的鲁棒性。经典图像去雾算法中暗通道先验算法具有复杂度低、实时性高等特点,但该算法对色彩信息不敏感且去雾参数需根据先验知识人工选择,在结合目标检测任务时存在一定的性能瓶颈。此外,
学位