【摘 要】
:
以社交网络为代表的大规模信息网络层出不穷,如何充分利用这些信息挖掘出适应于各种任务的通用表示显得尤为重要。现实生活中的大规模信息网络往往包含许多复杂的交互关系和语义信息,且具有多源异质性,这给传统的网络表示学习(Network Representation Learning)方法带来了挑战。深度学习的出现给网络表示学习开辟了新道路,极大的促进了网络节点表示学习研究的发展。本文基于图注意力机制和生成
论文部分内容阅读
以社交网络为代表的大规模信息网络层出不穷,如何充分利用这些信息挖掘出适应于各种任务的通用表示显得尤为重要。现实生活中的大规模信息网络往往包含许多复杂的交互关系和语义信息,且具有多源异质性,这给传统的网络表示学习(Network Representation Learning)方法带来了挑战。深度学习的出现给网络表示学习开辟了新道路,极大的促进了网络节点表示学习研究的发展。本文基于图注意力机制和生成对抗思想,针对当前面临的节点表示能力不足的问题,在异质信息网络和超图网络上展开研究。具体研究内容包括:(1)提出基于对抗图自动编码器的异质网络节点表示学习算法(Adversarial Variational Graph Autoencoder,AGVAE),使用对抗图自动编码器捕捉网络的全局结构,生成节点的低维稠密表示向量。其中,编码器部分采用双层图卷积网络实现,通过卷积的方式聚合节点的邻域特征,并作为解码器的输入重构网络。同时加入变分推理过程,对隐层向量加以约束。其次引入对抗性训练,生成模型部分与编码器共享同一个网络。鉴别模型可以看作是一个二分类任务,主要是将生成模型生成的假样本与从真实数据集采样得到的真样本进行鉴别,并根据鉴别结果反向更新生成模型的参数,从而实现模型的优化。最后,在联合优化阶段,增加了正则化约束,通过惩罚系数加大对不良结果的惩罚,以此达到优化的目的。(2)提出融合外部信息的异质超图网络节点表示学习算法(Hypergraph Attention Autoencoder,HATAE),该方法是在上面研究方法的基础上,进一步挖掘异质信息网络中的多元关联关系,着眼于更高阶的拓扑结构信息和低阶近邻度信息,通过模体抽取的方式匹配异质信息网络中的多元关联关系模式,进而抽取成异质信息网络子图,并命名为异质超图网络。主要是基于自编码器提出超图注意力机制将异质超图网络中节点信息和属性信息进行统一编码,经过解码器重构超边关联矩阵,保留节点的全局属性信息。同时加入节点近邻度函数,判断不同类型的节点是否属于同一个超边,保留其一阶近邻性。并将学习到的节点表示用于下游链接预测任务,通过实际的挖掘任务评判表示结果的鲁棒性。在一个同质网络数据集Cora和三个原始异质网络GPS、Movie Lens和Drug数据集进行实验。对于超图网络节点表示学习采用的数据集是抽取后的异质超图网络子图,并完成了与经典表示学习方法的对比实验。通过实验验证了AGVAE和HATAE算法在链接预测任务上均优于传统方法,充分验证了本文所提出的算法的有效性。
其他文献
传统文化教学是高中语文教学中重要的环节之一。学生在高中阶段已开始形成相对完善的人生观和世界观,有自己的独立思考能力和判断能力,对于传统文化,可以从更深层次去理解和接受。在小学和初中阶段,学生对于传统文化的理解处于有些懵懂的阶段。高中语文教材所选编的课题和内容,是中国传统文化所包含的精粹部分,将语文教学内容与中国传统文化融合,对学生形成积极向上的民族观、国家观和文化观有积极作用。
传统的单聚类方法是依据样本的相似度,将具有相似属性或特征的样本归为一类。然而,随着样本数和特征数的大量增加,单聚类方法的时间成本变得难以想象。另一方面,大型数据集内部数据成分复杂且往往呈现稀疏性,单聚类方法不能很好地处理大型数据集的噪声干扰。基于低维数据全局搜索的单聚类方法不能很好地适应于高维数据和大型数据的聚类问题。为克服单聚类方法存在的缺陷,双聚类方法应运而生。不同于传统单聚类方法,双聚类方法
驾驶风格主要指驾驶员的驾驶习惯,多通过驾车时的行为特征进行定义。驾驶风格与智能交通、无人驾驶、保险理赔都有着千丝万缕的联系。针对现今驾驶风格识别研究多存在数据来源不真实、考虑因素不全面、无法对驾驶风格进行整体把握等问题,本文通过采集真实的驾驶数据,以工况作为驾驶风格识别的最小粒度,构建了基于半监督学习的多工况驾驶风格识别模型。主要工作如下:1.搭建驾驶风格识别数据库。通过对日常驾驶风格影响因素的深
蛋白质是生命活动的重要物质基础,也是生命活动的执行者和调控者。少数蛋白质可以在生物体中单独执行特定功能,大部分蛋白质通过与其他蛋白质之间的相互作用以复合物的形式完成其特定功能。因此,精确高效地识别蛋白质复合物对于揭示细胞组织原理和功能机制具有重要意义,且对复杂疾病的诊断与靶向治疗具有一定的指导作用。本文基于生物信息学理论与机器学习算法,对蛋白质相互作用网络中蛋白质复合物的识别问题进行了研究。目前蛋
随着科技的飞速发展,人类生活中越来越离不开身份认证和识别。同时人们对个人信息安全的问题也更加的重视,传统的身份认证如密码登陆等已经很难满足人们对个人信息安全的要求。在这种需求不断提升和计算机技术高速发展的背景下,虹膜识别技术凭借着其更高的安全性、准确性、稳定性、防伪性等特点受到了来自学术界和工程界广泛的关注。虹膜识别产品也逐渐应用到与我们息息相关的生活中,如虹膜门禁系统、虹膜签到系统、银行支付系统
因果关系抽取是自然语言处理的一个重要研究方向,现有研究将因果关系抽取转化为关系分类或序列标注任务。文本中的因果关系有丰富的表达形式,对于句中的复杂因果关系和文章级因果关系,现有方法很难有效的抽取。此外,这些研究大多忽视了对因果实体间的语义关联信息的探索。针对上述问题,本文引入语义依存分析和预训练语言模型,结合深度学习的相关算法,提出了两个因果抽取模型,有效的从文本中抽取各类因果关系。具体内容如下:
随着二十一世纪互联网和信息技术的高速发展,技术论坛成为人们获取计算机专业知识的关键平台。人们通过技术论坛发表自己的原创文章,获取自己喜欢的专业领域内容,同时与业界专家互动交流专业领域问题,从而提高自己的专业技能。技术论坛主要发表大量的技术文章或提问,用户通过回帖来表达自己的观点。以往的论坛大多为综合性论坛,其广度的优点不能对每一个专题做到精益求精,提供了大量的内容却未对其进行有效搜索和推荐,导致用
语文学科教学除了要帮助学生掌握语文知识,还要提高学生的道德修养,提升他们的文化品位,使他们形成健全的人格。在高中语文教学中融入传统文化,能够促进教学任务的完成,带给学生更多启迪。本文将针对如何在高中语文教学中融入传统文化展开具体分析,旨在以文化为载体,提高课堂教学质量,营造良好的育人环境。
目的:椎动脉优势(vertebral artery dominance,VAD)是指双侧VA一侧管径较大或双侧管径相等时一侧VA与BA呈直线形连接的血管变异现象。人群中35.5-58%的人为左侧VAD,右侧VAD为19-35.7%[8,9]。现阶段研究认为VAD可能是PCI的危险因素[10]。与前循环缺血相比,后循环缺血患者发现椎动脉管径不对称的发生率更高,并与基底动脉(Basilar Arter
“逆城市化”是城市发展的一个阶段,准确把握中外“逆城市化”的研究热点及演进趋势,对于“十四五”阶段城市提质增效、乡村全面振兴具有重要意义。文章利用CiteSpace可视化分析软件,对1980-2020年的1 112篇中外文献进行了定量分析。研究结果表明,国外的“逆城市化”多为“单轨”运行制,而中国则为“双轨”并行制。从研究热点来看,国内对“逆城市化”的研究主要围绕城市发展阶段、人口流动、现象的总结