基于无信息先验分布的可解释变分图自编码器方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:ronaldocjz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及促进了复杂网络的发展,如何学习一个低维稠密的向量来表征复杂网络中的节点以便进行分析成为了一个研究重点。变分图自编码器凭借其强大的生成能力已经成为复杂网络表征的常用方法之一。然而目前变分图自编码器的研究存在两个挑战。1)已有的变分(图)自编码器及其变体大都假设隐变量服从标准正态先验或服从一个融入了很多专家经验的复杂先验,但是在很多实际情况中很难确定采用什么形式的先验或者先验概率很难获取。因此,如何在不引入额外专家知识的前提下,为隐变量设置一个合理的先验成为一项艰巨的任务。2)近年来基于图神经网络的模型在处理复杂网络方面取得了巨大的成功。然而这类方法通常是一个黑盒,使得学得的低维表示无法解释。提高图神经网络模型的可解释性可以增加人们对算法预测结果的信任以及及时纠正模型出现的系统错误。因此,如何提高模型的可解释性越来越成为一个热门的科学课题。考虑到以上两个挑战,本文的创新点主要包含以下内容:(1)提出了一种新的基于无信息先验分布的可解释变分图自编码器模型(NPEVGAE)。首次利用无信息先验的思想来改善变分图自编码器中隐变量的先验知识缺失问题,实现了在缺乏先验知识时为隐变量选择一个合适先验的目的。该模型突破了隐变量后验分布必须趋向于标准正态先验这一不切实际的限制,采用一种不随参数形式变化而变化的无信息先验分布作为隐变量的先验概率。该模型不再鼓励学得的隐表示聚集在原点,而是鼓励后验分布从输入数据中学习模型的参数,因此能够充分利用隐空间。本文通过详细的分析证明了无信息先验会对后验概率参数的学习造成很小的干扰,从而说明了无信息先验分布选取的合理性。(2)本文模型NPEVGAE提供了一种新的视角来理解节点的隐表示,提高了模型本身的可解释性。NPEVGAE将节点表示的每个维度视作节点隶属于每个块的软分配概率,使得节点表示变得可解释。同时节点所属的块之间的关系由块和块之间的相关度矩阵来刻画。在恢复图结构时,不仅考虑节点学得的表示,而且也考虑节点所属的块之间的相关程度,从而使得属于同一个块的节点有更大的概率相连。(3)本文选取了几种先进的网络表示学习算法作为对比算法,在链接预测和半监督节点分类任务上进行的大量实验验证了本文提出的基于无信息先验的可解释变分图自编码器模型的优越性和效率。最后通过可视化工具直观展示了本文模型能够有效地区分不同类别的节点并且能充分利用潜在空间。
其他文献
我国证券市场起步较晚,在对会计信息披露违规的监管方面还是存在着许多不足,给一些有不好动机的管理人员留下了信息披露违规的漏洞,上市公司的会计信息违规披露行为使中小股东的投资方向直接受到影响,经济利益受到损害,此外证券市场的秩序也会受到一定程度的扰乱,阻碍资本市场的正常发展。伴随着市场经济的发展和资本市场的繁荣,虽然我国相关部门也在不断加大监管力度,然而会计信息披露违规的现象依旧存在,上市公司会计信息
当前国内大多数城市公立医院都已实现了信息化建设,信息技术在医院管理中的广泛应用和现代医院管理科学的飞速发展,医院信息化管理的重要性已得到社会的普遍认同。医院内外环境均需要信息支持,数据互联互通信息共享。信息化和大数据互联互通在医院经济运行中的应用和管理尤为突现。财务管理为医院的重要工作,管理能力高低同医院良性发展直接相关。基于大数据技术,
期刊
背景:胼胝体是处于人类大脑中线位置的重要的白质结构,其功能为在人类进行活动时协调双侧大脑半球的运作,胼胝体的联合纤维在大脑半球中占据着重要的地位。胼胝体肿瘤在临床上最常见的是胶质瘤,其余类型的肿瘤有淋巴瘤、脂肪瘤等。胼胝体膝部及体部最常见于肿瘤生长,而临床上较少遇见胼胝体压部肿瘤。通常认为胼胝体功能重要,部位较深,手术难度较大,因此,对此处肿瘤行手术治疗被风险是大于收益的。然而伴随影像学技术的提高
推进课程改革几年来,我们结合实际,对临川传统教育文化的继承与发展进行了深入的研究,我们确定推进课改的总体思路是:按照"弘扬临川文化,谋划和谐发展,成就幸福人生"的教育发展理念,确定"一个中心"—以实施素质教育为中心;强调"两个统筹"——城区学校与农村学校的统筹发
期刊
随着计算机技术的不断发展,人类社会中的各个方面开始与之产生紧密联系。人们日常生产生活中产生的海量数据大多以电子化的形式存储在关系型数据库中,在对这些数据进行访问时,往往需要编写SQL(Structured Query Language)来对数据库进行操作。但是,SQL本质上是一种计算机编程语言,编写SQL需要一定的专业知识,此外,还需要了解所访问的数据库模式。通过自然语言来与数据库进行交互查询数据
目的:探讨硬腭粘骨膜、掌长肌腱、鼻唇沟皮瓣这一“三明治结构”在全下睑再造中的可行性。方法:收集2015年至2020年于吉林大学第一医院治疗的因外伤或肿瘤切除导致重度下睑全层缺损行全下睑再造的13例患者的临床资料,对其进行回顾性分析,年龄范围23~61岁,平均年龄为42.2岁,10例为男性(71%),3例为女性(29%),病变部位:左下睑7例,右下睑6例,所有均累及眼睑全层,修复下睑缺损的面积为3c
血栓性疾病,如中风和缺血性心脏病,依然是全球死亡率及致残率最高的疾病。血栓的形成是一个复杂的、动态的、多步骤过程,涉及到生物化学反应、力学刺激、血流动力学等多个方面。近年来,人们已经从这些方面出发做了大量的研究,以期全面地理解血栓的形成机理,更好地预防及治疗此类疾病。然而,无论是从实验、数值还是理论角度,这都存在着巨大的挑战。实验上,受体内测量精确性限制,观察结果的可靠性往往难以保证;数值上,受血
背景:甲基鸟嘌呤-DNA甲基转移酶(MGMT)的高表达是导致胶质瘤对替莫唑胺产生耐药的重要原因。近些年来有研究表明Wnt/β-catenin和NF-κB通路与MGMT介导的替莫唑胺耐药相关。生酮饮食在实验和临床研究中表现出较强的抗胶质瘤作用,但是其对于胶质瘤治疗过程中增强替莫唑胺疗效的研究相对较少。生酮饮食可以调控NF-κB和Akt通路,但是其对于MGMT影响的相关研究较少。目的:探究生酮微环境对
甲骨文是中国最古老的文字体系,它是汉字的起源,也是中华民族优秀传统文化的根。甲骨文识别的任务是确定甲骨文的字符类别,它是完成甲骨文释读的必要前提条件。目前,对拓片上的甲骨文进行自动文字识别工作主要依赖专家的特征工程。工作内容复杂且工作量大,需要大量的人工成本和时间成本。所以对甲骨文进行自动图像识别具有重要研究价值。目前卷积神经网络在图像识别域已经取得了很大的成果。本文利用卷积神经网络中的ResNe
国内外经济环境的不断变化加剧了国内企业之间的竞争,如何提升企业核心竞争力是所有企业所面临的关键问题。从企业财务的视角而言,财务管理贯穿企业经营中的所有主要经济活动,建立完备的财务内部控制体系是企业竞争力的重要保障,具有举足轻重的意义。电力行业是国家重要能源产业之一,关乎国家经济发展、工业发展及民生等多项重要领域,电力行业的行业封闭性使供电公司在财务内部控制方面存在很多隐患。本文以蓝天供电公司作为研