多模数据融合的网络表征学习方法及应用研究

来源 :太原理工大学 | 被引量 : 0次 | 上传用户:milksnake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络能表达不同事物的关系,在日常生活中无处不在,如社交网络、交通网络、互联网络等等。网络表征学习则把网络中每个节点表示成低维稠密的向量,便于计算,可灵活的用于各种网络分析任务。而网络数据往往是复杂的,如社交网络中,节点包含的用户属性、文本、标签等,边包含的用户交互信息,用户不同互动行为构成的多结构,以上表现形式不同的信息构成本文研究的网络多模数据。融合网络多模数据的表征学习可利用数据间关联,挖掘其隐藏的规律,提高网络表征质量。本文针对当前融合表征学习方法未能充分考虑更多有用的模态数据,提出了两种多模数据融合的网络表征学习方法,主要贡献如下:1)针对社交网络中文本与多结构混杂的情况,提出了融合好友关系结构、交互关系结构及节点文本的网络表征学习方法。首先,针对典型的基于矩阵分解的、融合结构及文本的网络表征学习方法TADW没有考虑文本特征矩阵在分解式中的位置是否影响网络表征效果的问题,通过大量数据实验分析其影响。其次,在此基础上,分析各种模态数据间的联系,把网络的多结构及文本映射成低维的特征矩阵,并放置在分解式中最优的位置,通过矩阵分解融合多模数据学习网络表征。最后,在Microblog数据集上完成用户兴趣发现实验,结果表明,该方法优于其他经典的方法。2)针对网络中节点和边语义信息以及网络结构并存的情况,提出一种基于自动编码器和翻译机制的网络表征学习方法。模型使用多个自动编码器分别对节点和边信息进行表征,并利用翻译机制有监督的建模节点和边,保持网络结构。模型通过协同优化更新表征,实现多模数据的有效融合。最后,在ArnetMiner平台采集的数据集上进行了两种多关系抽取实验:合作多关系补全,新作者间多关系预测。与经典方法相比,本模型在两个不同任务上的准确率均有所提高。表明本算法不仅在发现隐含多关系上具有较好效果,而且在不重新训练模型的情况下,能够预测动态网络中新增节点引入的多关系。
其他文献
目的:探讨肠内生态免疫营养对结直肠癌患者术后营养、免疫、炎症及康复的影响。方法:将60例结直肠癌患者随机分为肠内生态免疫营养(试验组)和常规肠内营养(对照组)两组,分别在术后第
随着超大规模集成电路和EDA工具的快速发展,可重用设计方法已经成为设计片上系统芯片(SoC)的首选方法,使用该方法能够在芯片设计过程中有效地节省项目开发费用、缩短工程设计周
本文在对中外老龄居住环境的分析与比较基础上,结合老年人的活动特点及具体案例,分析了中国城市老年社区在空间与环境设计上的要点
贿赂犯罪严重侵害了职务行为的廉洁性,严重侵害了国家机关的正常管理秩序,但是由于贿赂犯罪本身具有的隐蔽性,致使对贿赂犯罪的侦查取证工作越来越困难,引用特殊的证据规则成
传统的金属-氧化物-半导体场效应晶体管是在半导体结的基础上而形成的。通过在器件的栅极施加电压偏置,半导体结可以对电流实现截止和流通的控制作用。当半导体器件的尺寸缩小
随着集成电路芯片的设计进入到纳米技术阶段,电源网络设计和分析成为制约其快速发展的关键因素。电源网络中诸多的设计问题易于引起电路逻辑功能错误,进一步可能引起致命问题,即
生态工业园是一种新型的工业组织模式,其在建设过程中会运用到多种生态理论,其注重经济、环境与社会的协调发展。所以,生态工业园在环境保护中发挥着重要的作用,是对生态绿色
英语广告的修辞艺术潘红广告,是现代生活的一个重要组成部分,它的目的是激发人们行动或者购买的欲望。因此广告语言必须具有注意价值(attentionvalue)、记忆价值(memoryvalue)、可读性(readability)、和说服力(persua...
近期,知识付费热似乎“退烧”了。去年6月,《李翔商业内参》在罗振宇推出的知识付费APP“得到”上线,马云、雷军等人纷纷为其背书站台,使得该专栏一度创造两周内收获超过5万的付
以片上网络(NoC)为代表的众核技术已成为当今研究热点。众核芯片集成度的增高使得由系统软错误和硬错误导致的可靠性问题日益凸显,片上网络容错技术是提升众核系统可靠性的重要