【摘 要】
:
随着信息技术的发展,图作为一种便捷且有效的建模方式,被广泛用于表示复杂的结构化数据。异常节点检测是图分析领域中的重要课题,在诸如社交网络的恶意账户检测,金融网络的欺诈检测等现实生活中有着广泛的应用。图异常节点检测场景的数据往往具有复杂的拓扑结构关系,传统领域的异常检测方法难以处理复杂的关系,此外,信息多元,标签不平衡等特点也造成现有的异常节点检测算法在性能上不尽如意,影响异常检测任务的表现。为了高
论文部分内容阅读
随着信息技术的发展,图作为一种便捷且有效的建模方式,被广泛用于表示复杂的结构化数据。异常节点检测是图分析领域中的重要课题,在诸如社交网络的恶意账户检测,金融网络的欺诈检测等现实生活中有着广泛的应用。图异常节点检测场景的数据往往具有复杂的拓扑结构关系,传统领域的异常检测方法难以处理复杂的关系,此外,信息多元,标签不平衡等特点也造成现有的异常节点检测算法在性能上不尽如意,影响异常检测任务的表现。为了高效的处理图场景的异常检测问题,提高异常节点检测的性能,本文分别从同构图异常节点检测、异构图表示学习技术和异构图异常节点检测三个不同的方面进行了技术研究,主要贡献如下:(1)针对现有的同构图异常节点检测技术目标驱动性不足,以及任务无关的噪声边混合到邻域聚合过程中带来的性能不佳问题,提出了一个融合属性信息的同构图异常检测技术。该技术首先设计了一个基于图神经网络的面向异常检测任务的半监督损失函数直接用于检测节点的结构异常从而充分利用无标签以及有标签数据;同时,本文构建了一个对称的深度神经网络检测属性异常作为节点结构异常的补充,缓解图神经网络聚合过程中的噪声边。此外,本文在五个数据集上验证了模型异常检测效果。(2)针对异构图场景中的多视角图表示学习技术如何提取单个视角的独特信息,提取视角间的一致性信息,以及衡量不同视角重要性的问题,设计了一个基于对比学习的无监督异构图表示学习技术。首先,模型在每个视角下利用对比学习技术无监督的帮助编码器提取具有强判别力的节点特征;其次,模型在不同视角间利用对比学习技术学习不同视角间的一致性;最后,提出了一种基于互信息的视角重要性衡量方法生成节点表示。本文在多个数据集上验证了学习的节点表示在节点分类,聚类,相似性搜索以及欺诈检测等图分析任务上的有效性。(3)针对异构图欺诈检测场景存在着的伪装问题、数据稀疏问题以及类别不平衡问题,提出了基于增强图学习的异常节点检测框架。在该框架中,首先利用参数化的神经网络得到节点间的相似性以缓解特征伪装问题;紧接着,以相似性为中心节点筛选噪音邻居和添加更多的邻居,增加同类节点的边以及减少不同类节点间的边,从而缓解关系伪装和数据稀疏问题;同时,该框架通过互信息学习的方式增强节点表示质量;最后,考虑到真实场景下类别不平衡问题,设计了一个类别感知的损失函数进一步提高模型的异常检测效果。该框架在几个公开数据集上优于近期异常检测算法,消融实验和参数实验也验证了各个模块的作用。
其他文献
近年来,随着城镇化、工业化快速推进,加强了城乡建设用地和社会经济发展的互动关系。我国长期特殊的城乡二元结构主要表现为城市对建设用地的需求持续增加,出现不断供给却日益紧缺现象;而在乡村则表现为人口不断涌入城市,其建设用地不减反增,进而造成乡村建设用地大量闲置。作为川滇黔结合部中心城市的七星关区目前正处于经济快速发展的关键时期,是国家特色农业和旅游业、重要新型工业基地,更是生态脆弱喀斯特山区工业化和城
在经典金融时间序列和函数型金融时间序列建模中,波动模型GARCH、SV以及扩散过程等都是主流的模型,其中GARCH和SV模型具有相同的扩散过程作为它们的极限。在这些模型的统计推断——参数估计和假设检验中,拟似然方法都有着广泛的应用,其中一个主要原因是在现实中往往无法获得真正的似然函数。到本文写作之时,基于拟似然的GARCH、SV和扩散模型的拟似然统计推断方法已有不少的研究成果。本文对这些成果进行了
文档级情感分类作为自然语言处理领域内的重要任务,一直以来广受关注。而得益于互联网技术的发展,用户在网络上发表的文本不断积累,为相关研究提供了扎实的数据基础。随着设备算力的提升以及可多层堆叠的Transformer结构的提出,一大批预训练语言模型在近些年间开始涌现。这些模型通常具有层次深、参数多的特点,并在大规模语料上提前进行了预训练,因此一经提出就在各种文本相关任务中达到了卓越的性能。近年来,如何
在互联网深刻影响人们生产、生活的时代背景下,网络素养成为公民在网络空间生存发展的必备素养。随着网络空间与现实社会的深入融合,互联网在国家间日渐激烈的竞争中,展示出“兵家必争之地”的态势。2014年,党和政府在掌握时代发展大势和国际局势的基础上,结合自身发展要求和发展目标正式提出了“网络强国”概念。新的发展目标势必带来新的发展要求,如何在新的要求下提升公民网络素养,助力“网络强国”的实现成为学界需要
甲烷无氧偶联(NOCM)是催化领域的重要课题,为甲烷的直接利用开辟了新途径,因其碳原子利用率高、工艺流程短而倍受关注。目前,NOCM反应仍面临着甲烷转化率低、反应温度高、催化剂稳定性差等问题。近年来,熔融液态金属催化剂因其优异的抗积炭性能在多相催化领域引起广泛关注。体相金属W具有高活化甲烷能力但易积炭,低熔点In可大幅减低W的熔点而使其以单原子和/或原子簇的形态存在,进而有可能构建低温高活性、低生
农村居民点是一定规模农村人口根据自然、社会、经济条件及血缘关系集中进行生产生活的场所,其形态受自然、经济社会和政策调控综合影响。伴随新农村建设、新型城镇化和城乡统筹等重大战略的深入推进,中国农村居民点正在不断转型与重构,出现了乡村人口流失的同时农村居民点用地面积反而不断增多的悖象。建设用地扩张势必导致乡村生产空间与生态空间遭受挤压,加剧乡村功能空间结构失衡,引发三生功能产生矛盾冲突,带来生态环境退
在高维情形下关于多元正态分布协方差矩阵的估计一直以来都是统计学中的基础问题。在诸如异常心电图分析这样的实际问题中,我们得到的高维数据只有几个分量是脉冲的,其余分量全是稀疏的。本文将此情形下所对应的协方差矩阵称为Sparse-Spike协方差矩阵。在高维数据处理问题中我们得到的样本数常远小于矩阵维数,本文将小样本情形下对于协方差矩阵的估计和特征提取称为它的低秩学习。本文所研究的Sparse-Spik
商圈是一个城市的商业招牌,也在一定程度上反映了当地经济发展的水平。商圈分析可以帮助国家和地方政府了解商圈发展态势,为制定商圈发展规划和政策导向提供科学依据。另外,商圈分析还能为经营者选择经营场所、制定和调整经营方针和策略提供依据。基于以上背景,本文以上海市商圈为研究主体,基于银联数据,采用统计学方法,对商圈客户转移消费问题进行了深入分析。由于商圈之间的客户转移数量是一个矩阵数据时间序列,并且某些商
相较于单臂机器人,双臂机器人拥有冗余的自由度,能够执行更灵巧的操作和完成更复杂的协同任务。双臂机器人在进行灵巧操作时,末端执行器之间的距离往往非常接近,在对双臂协作机器人进行轨迹规划时,要求提供十分精确的碰撞检测算法,以保证机械臂的安全。针对上述问题,本文对面向双臂协作机器人的连续碰撞检测算法进行研究,主要研究内容为:·提出了一种面向双臂协作机器人灵巧操作的连续碰撞检测算法,该算法基于泰勒模型在机
近年来,深度神经网络在许多分类任务中已经达到了很高的准确率,这些任务包括语音识别,目标检测以及图片分类等。尽管深度神经网络对随机的噪声是具有鲁棒性,但是当对神经网络输入添加一些不能被人眼察觉的特殊扰动会使得深度神经网络模型输出错误的预测值。通常把这些添加了特殊扰动的样本称作对抗样本。为了使得深度神经网络的鲁棒性提升,对于深度神经网络防御对抗样本的方法进行了研究。在对抗防御的方法中包括三种:梯度遮蔽