大规模属性网络的表征学习方法研究

来源 :烟台大学 | 被引量 : 0次 | 上传用户:spredsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中有许多复杂的网络系统,例如社交网络、生物分子网络和互联网等,利用网络结构建模这些复杂系统的研究已为社会提供了诸多创新应用。网络表征学习(又称网络嵌入)是将网络的节点表征为低维连续空间中的向量,且同时保留网络结构及其固有属性的一种有效方法,推动了下游网络数据挖掘任务的重大进展,近年来受到了学术界和工业界的极大关注,工业界已将网络表征学习技术纳入了下一代网络分析平台的基础性架构。本硕士论文围绕大规模属性网络的高效表征学习提出了三种表征学习框架,主要研究内容如下:
  (1)面向大规模属性网络的动态表征学习,提出了一种基于随机投影的高效动态属性网络表征学习算法,该算法分为静态学习和动态更新两个部分。首先,静态学习部分在网络表征中融合了节点的高阶结构邻近性和高阶属性邻近性,利用矩阵的乘法结合律设计了一种预投影机制,提升了大规模属性网络的表征学习效率;然后,动态更新部分通过增量矩阵计算实现大规模属性网络表征向量的高效迭代更新。
  (2)针对大规模多层异质属性网络的快速表征学习问题,提出了一种基于随机投影的高效多层异质属性网络的表征学习框架。首先,将多层异质网络解耦为多个简单的同质网络和仅包含一种边类型的二分网络;然后,引入不同边类型的重要性将解耦后的简单网络重新分配权重后聚合为新邻接矩阵;之后,对新邻接矩阵进行图转换自动获得网络中不同长度的元路径信息,避免了需要手工选择元路径的问题;最后,利用随机投影矩阵代替图卷积神经网络中的权重矩阵,有效提升了网络表征的学习效率。
  (3)针对时序网络的动态表征学习,提出了一种融合网络motif的动态属性网络表征学习框架。首先,设计了一种融合网络motif的图神经网络,可以有效融合网络邻接矩阵中成对节点间的网络结构以及网络motif矩阵中局部高阶结构特征。然后,为了有效且高效地捕获不同时间快照间的时间演化关系,设计了一种模拟时间维度上一维卷积操作的时间移位模块,并结合融合网络motif的图神经网络将网络的历史信息融合到网络的动态表征向量中。
  本文在多个大规模真实网络数据集上分别验证了所提三种表征学习方法的有效性和高效性。
其他文献
文本匹配是指从语义或意图层面衡量两个文本的相似程度。文本匹配任务属于自然语言处理的基础性研究,其效果对文本蕴涵、自动问答、信息检索等诸多下游任务具有重要影响。传统的文本匹配方法通常依赖于文本的字面特征以及人工定义的规则衡量文本是否匹配,忽视了文本间的深层次语义匹配特征。与传统文本匹配方法相比,深度学习方法能够有效捕获文本的深层次语义特征,具有良好的模型泛化能力,在文本匹配任务上具有出色的表现。文本
学位
心电图(Electrocardiogram,ECG)是诊断心脏疾病安全有效且快捷的方法,同时ECG是用于心脏疾病检测、分类和治疗的重要指标。因此,高效准确地去除ECG中的噪声对心脏疾病的辅助诊疗有着重要意义。在此背景下,本文将结合心电信号的稀疏特性,采用神经网络方法深入研究心电信号的降噪问题。本文主要的创新点将从以下三方面展现。(1)针对传统的基于滤波器的降噪方法对信号的适用性不强的问题,本文提出
学位
据统计,我国已建成全球规模最大的供暖管网。通常管道经过闲置可能出现老化、锈蚀,导致管口渗水。供暖面积的增加,对管道检修带来挑战。针对供热管道来说,依赖管道机器人的检测方法,只能工作于非供暖时段,在供暖季节无法运行。红外无损检测通过采集并将红外线辐射转换为二维图像的方式,不触碰和破坏被测物体,通过红外图像直观反映物体的温度分布情况。本文以红外无损检测技术为基础,结合成熟的无人机技术,使用数字图像处理
学位
随着智能制造工业领域的飞速发展,设备发生故障的现象无法避免,同时也带来了巨大的经济损失,因此对工业设备故障进行快速而准确的判断具有重大意义。由于工业设备多数故障信息具有模糊性且故障源的判断易受多种因素的影响,而具有灵活转换特点的三角模糊数可对故障信息进行准确描述,它相应的决策方法也可对故障诊断问题进行全面分析,故面向故障诊断的三角模糊数决策方法是一个值得探索的研究方向,且具有较强的应用性。本文主要
学位
心脏病始终是人类健康的“头号杀手”。心电信号反映了心脏的收缩和舒张,是分析人体健康状况的重要依据。近年来涌现了大量利用人工智能技术来分析心电信号的研究,用于辅助心脏病的诊断。这在一定程度上为医疗工作者减轻了工作压力,提升了工作效率。然而,心脏病患者的情况是十分复杂的,特别是在突发紧急情况下,单纯的心电信号分析研究不能满足患者实时心率监测的需求。为此,应用边缘智能技术实时监测患者的心率情况成为一种新
学位
大数据时代,推荐系统在对抗信息过载问题上起到了重要作用。传统的协同过滤推荐算法仅利用交互信息进行建模,由于可供模型训练的数据种类单一、信息不足,可能导致推荐效果不佳,因此,许多工作将文本作为辅助信息引入到推荐模型中以提供额外的数据输入。但是,现有的基于文本的推荐方法往往忽略了用户的多样性偏好(用户的偏好特征会随着面对的项目不同而改变),或是没有在建模过程中充分利用输入的文本信息。针对上述问题,本文
学位
基于效用的序列规则挖掘能够挖掘出效用价值高的序列规则,被广泛的应用于金融、生物医学、制造业、电子商务、社交媒体等领域。与高效用正序列规则挖掘相比,高效用负序列规则挖掘还考虑了未发生事件,能提供更加全面的决策信息。目前的高效用正序列规则挖掘方法并不能直接用于高效用负序列规则挖掘,因高效用负序列规则挖掘过程中存在很多内在复杂性问题:(1)如何定义高效用负序列规则挖掘的问题。(2)如何计算高效用负序列规
学位
暗网构建在公共网络之上,需要特殊的软件、配置或者认证才能访问,相对传统的互联网网络,暗网具有匿名性强、溯源难、动态性高等特点。暗网建立的初期目的是保护互联网用户的通信隐私,但现在的暗网中存在着大量违反法律的信息,不法分子在暗网中从事非法活动,暗网已经严重威胁了网络空间安全。暗网之所以对网络空间安全构成一大威胁,很大原因是因为它难以实现追踪溯源,能够实现对暗网的追踪溯源,将可以对暗网中的非法行为起到
学位
偏好学习是通过矩阵分解得到潜在特征,广泛应用于数据挖掘和机器学习领域。对于没有任何负项的数据集,非负矩阵分解(Non-negative Matrix Factorization,NMF)将两个非负矩阵相乘来寻找低秩近似。近年来也提出了许多正则化的NMF,但是,仍然存在一些问题:一是由于一些数据中存在噪声和异常值,传统的方法容易产生误差较大的目标函数;二是在加入图正则约束时,计算相似度矩阵邻居关系都
联盟形成是多Agent系统中的重要研究课题,多个不同的Agent联合在一起,可以实现个人无法单独实现的目标,或者取得更优的效用。联盟结构生成问题是其中的关键挑战之一,目的是寻找最优联盟结构以最大限度地提高个体利益和联盟收益。目前,寻找最优的联盟结构是困难的。一方面,大多数联盟形成模型假设任意Agent都能够形成联盟。这种假设过于宽泛,在现实生活中,联盟的形成过程常常需要考虑现实存在的各种约束,但即使添加约束条件,问题的复杂度仍然较高,需要新的、快速有效的算法解决大规模现实
学位