基于深度模型的网络表示学习方法的研究与实现

来源 :东南大学 | 被引量 : 1次 | 上传用户：fsb820101

【摘要】

：

现今,网络作为数据的重要载体,其结构随着互联网数据的指数级增长变得越发复杂。在一个网络中,除了节点本身蕴含的信息外,节点之间的关系也拥有巨大的数据挖掘价值。网络表示

【作者】

：

武文茂

【出处】

：

东南大学

【发表日期】

：

2018年01期

【关键词】

：

网络表示学习深度学习半监督已知标签节点属性邻居重构

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现今,网络作为数据的重要载体,其结构随着互联网数据的指数级增长变得越发复杂。在一个网络中,除了节点本身蕴含的信息外,节点之间的关系也拥有巨大的数据挖掘价值。网络表示学习的出现是为了解决传统网络分析技术的局限性,以应用于现在的大规模网络以及复杂的机器学习、数据挖掘任务。基于矩阵分解的网络表示学习方法能够做到重建网络,但是很容易产生过拟合现象,整体的表现并不尽如人意;基于自然语言模型的网络表示学习算法虽然能够不同程度地利用网络结构进行网络表示学习,但是它们均属于浅层模型,这也就意味着它们很难学习到网络结构深层的、更复杂的特征。深度学习近几年发展迅速,在多个领域取得了重要进展,其本质就是对数据特征进行深层次的抽象,学习高维数据到低维特征的映射函数。而网络表示学习也可以看做是将节点的表示从原网络的高维空间转换到一个低维向量空间中的过程,其本质问题是学习两个向量空间之间的映射函数。因此,出现了基于深度学习的网络表示学习方法。然而,现有的基于深度学习的网络表示学习方法大多仅使用网络结构进行网络表示学习,未使用节点标签以及节点的自身属性,无法更好的反映节点的真实性,因此,本文针对基于深度学习的网络表示学习方法进行了研究主要工作如下:(1)针对堆叠自编码器对输入数据的噪声没有鲁棒性以及已有模型未加入标签信息的缺点,提出了基于压缩自编码器的半监督网络表示学习模型LSDNE(Labeled Structural Deep Network Embedding)。该模型在SDNE模型的基础上,将SDNE模型的普通堆叠自编码器SAE替换成压缩自编码器CAE,并使用SVM分类器作为模型的有监督部分,使得已知标签的信息能够融入网络表示学习过程中。LSDNE在Citeseer数据集和Cora数据集上的实验表明压缩自编码器CAE使得LSDNE的泛化能力比使用普通堆叠自编码器SAE更优秀,同时LSDNE模型相较于现有的模型具有更好的标签预测精确度。(2)在现实世界的网络中,除了网络结构和节点标签,节点本身会包含各种属性,这些属性可以作为侧面信息融合到网络表示学习的过程中。当LSDNE应用于属性网络时会产生大量超参数,会大大增加模型的复杂度,降低模型训练效率。为了更好地利用网络节点的本身属性,减少模型参数及复杂度,受LLE(Locally Linear Embedding)算法启发本文提出了一种基于邻居结构的半监督网络表示学习模型SLLDNE(Structural Labeled Locally Deep Nonlinear Embedding)。实验证明SLLDNE在减少了参数的情况下效果与LSDNE相当。在SLLDNE的基础上进一步加入节点属性提出了SILDNE。通过SVM分类器对已知标签进行分类,SILDNE将网络结构、标签、节点属性三者融合到深度神经网络中。实验验证SILDNE模型在应用于标签预测任务时的效果优于已知的方法。

其他文献

风池扶突穴位针刺安全深度的MRI和尸体对照研究

目的:通过对风池、扶突穴位采用MRI和尸体断层解剖测量出针刺危险深度,计算出安全深度,为临床医生针灸操作提供安全参考指标。方法:(1)选取健康成年男性志愿者,筛选出研究对

期刊

风池穴扶突穴深度MRI尸体

长距离输水工程突发污染事故风险分析

以南水北调中线工程输水干渠突发污染事故风险为目标,通过污染事故风险源识别,确定突发污染事故的主要风险源;以店北公路桥突发污染事故风险为研究对象,考虑天气、道路状况、

期刊

贝叶斯网络风险分析水污染输水工程

奇正消痛贴膏对兔耳软组织损伤影响的活体观察

目的：观察奇正消痛贴膏对活体兔耳软组织微循环的影响,为临床应用提供基础资料。方法：新西兰大白兔10只,制作兔耳软组织损伤模型,在第1、2、3周分为3组,每组10只兔耳,空白给药

期刊

奇正消痛贴软组织损伤外治法微循环动物实验

处理零计数过多数据的两部模型方法介绍

在公共卫生、社会科学等领域的调查研究中,定量数据可能会包含过多零值,定性数据也有可能存在着零膨胀~（[1]）,如果仍按照一般模型（如泊松回归或线性回归）的数据分布假设进行分析,

期刊

两部模型定性数据分布类型半连续医疗费用零膨胀模型广义泊松分布方法介绍

服务型政府管理中的协商民主研究

服务型政府作为当前我国政府改革的目标模式,体现了以人为本的价值取向。政府向公民和社会提供服务的过程不是单向度的,而是多主体之间的互动过程。协商民主的发展有利于更好

期刊

服务型政府公共服务协商民主公民参与

糖尿病胃轻瘫发病机制的研究进展

糖尿病胃轻瘫（DGP）是在糖尿病病程中出现的以非机械性梗阻所致的胃排空延迟为主要特点的症候群,为糖尿病常见的慢性并发症之一。其主要临床症状为上腹饱胀、腹痛、早饱、恶心、

期刊

糖尿病胃轻瘫发病机制组织学

儿童咳嗽变异性哮喘的病因病机探讨

<正>咳嗽变异性哮喘(cough variant asthma,CVA)是以持续或反复发作性咳嗽为主要表现的特殊类型哮喘,又称咳嗽型哮喘、隐性哮喘。随着环境污染和生态破坏所造成的改变,近几年

期刊

儿童咳嗽变异性哮喘病因病机

昆虫干细胞研究进展

干细胞是一类具有自我更新和分化潜能的细胞,按照其来源可分为胚胎干细胞和成年干细胞。昆虫中也同样存在多种干细胞。开展昆虫干细胞自我更新、发育命运决定、分化潜能等特

期刊

昆虫果蝇干细胞

心血管疾病患者静脉留置针堵管原因分析及预防措施

脉输液是常见的护理操作,为保护静脉,避免复方穿刺,留置针已被普遍接受和认可。静脉留置针除能减少反复穿刺带给患者的痛苦外[1],还能满足中小手术建立静脉通路补液的需要,现

期刊

心血管留置针原因预防措施

辛亥革命的价值与启示

辛亥革命对于当代中国政治发展的意义,在于开启了中国现代民主政治发展的新篇章,重构了中国社会的阶级阶层结构,开始了根除封建专制主义消极影响的进程,是新民主主义革命和社

期刊

辛亥革命中国政治发展现代化

基于深度模型的网络表示学习方法的研究与实现

与本文相关的学术论文