基于图卷积神经网络的属性异质网络嵌入学习研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:xiexinhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和互联网应用的增多,每天都会有海量的网络数据被保存下来。这些网络数据的分析可以揭示网络中隐藏的信息,辅助人们做出决策。但是,网络的规模通常较大,结构也比较复杂,这给网络分析造成了很大的挑战。网络嵌入将网络转换到一个低维空间,在这个低维空间中保存网络的信息,为解决网络分析问题提供了一种有效的方法。属性异质网络是一种包含了多种类型的节点和边的网络,其中不同类型的节点具有不同的属性信息,也就是说,属性异质网络中节点的属性也是异质的。如何处理属性异质网络中拓扑结构和属性的异质性,在嵌入空间中尽可能的保存属性异质网络中的丰富信息,是属性异质网络嵌入存在的难点。另外,由于网络中节点的标签往往很难获得,所以研究如何对属性异质网络进行有效的无监督嵌入具有十分重要的意义。针对以上问题,本文研究了属性异质网络的嵌入学习,主要工作概括如下:(1)提出了一种针对属性异质网络的嵌入方法(Attributed heterogeneous network to vector,AHN2Vec)。AHN2Vec使用多关系图卷积网络(Relational Graph Convolutional Network,RGCN)来保留属性异质网络中节点的k阶邻域属性,使用不同的线性变换保留不同类型节点的原始属性,并通过结合两种属性的重构来保留属性异质网络中的节点属性信息和其k阶邻域属性。同时,为了保留属性异质网络中的拓扑结构信息和语义信息,AHN2Vec通过基于元路径的随机游走来获得属性异质网络中富含不同语义信息的节点序列,然后结合跳字模型,利用这些序列中节点的邻近关系来无监督地学习节点的嵌入,从而在嵌入空间中保留异质网络的语义信息、节点及其k阶邻域属性、拓扑结构信息。最后,针对属性异质网络嵌入的具体过程,优化了AHN2Vec模型的实现过程并给出了相应的伪代码。(2)在3个真实数据集上,对AHN2Vec模型所产生的嵌入进行了节点分类、节点聚类、相似性查询等实验,并进行了模型的参数敏感性实验和节点可视化。实验结果表明,AHN2Vec整体优于对比算法,能够针对不同属性异质网络产生高质量的节点嵌入,并在对比实验中取得优异的表现。(3)设计了一个网络嵌入原型系统,该系统集成了AHN2Vec及其他对比算法,可以对不同的网络进行无监督嵌入,并且在训练完成后,可以选择不同的对比实验对相应的嵌入向量进行性能评估。
其他文献
高考制度是我国学历教育阶段最重要的人才选拔方式,引导和决定了基础教育的发展方向。作为莘莘学子十年寒窗的临门一脚,高考志愿填报成为了考生及家长在高考后最关注的问题。但由于考生缺乏对招生政策的了解、自我定位不准确,存在招考双方信息不对称博弈、数据分析不准确等问题,考生难以独立完成志愿填报工作。现有的高考志愿填报研究包括志愿填报影响因素、志愿填报辅助决策技术、填报策略等。现有的高考志愿填报影响因素分析全
学位
随着海量数据的爆发,信息过载已经成为妨碍人类社会进步的一大阻碍,推荐系统的出现有效地解决了信息过载的问题,它可以帮助用户筛选并过滤海量信息,更好地找到自己需要的产品和服务。推荐系统本质上是为用户和商品画像的问题,然而,数据稀疏性、可解释性制约着推荐系统的性能,利用深度学习技术和辅助文档建模可以有效缓解推荐系统的掣肘。为此,本文针对推荐系统中的评分预测问题,提出了利用评论建模和多任务学习的深度推荐系
学位
聚乙二醇二丙烯酸酯(PEGDA)是PEG众多衍生物中的一种,是经美国食品药物监督管理局批准的可用于临床的聚合物,但由于自身具有较高的细胞毒性,以及较差的降解性,限制了其在生物医学领域的进一步应用。透明质酸(HA)作为人体体液最重要的成分之一,不仅具有较强的亲水性、生物相容性以及生物降解性,而且HA的结构中含有多个亲水性基团(-OH),可以与PEGDA形成氢键进行物理交联,增强PEGDA与HA结合,
学位
白光发光二极管(White Light-emitting diodes,WLEDs)在照明领域和显示器领域扮演着举足轻重的角色,其包含蓝-黄或红-绿-蓝多种颜色的发射。In Ga N蓝光芯片上涂覆Y3Al5O12:Ce3+(YAG:Ce)黄光荧光粉是商用WLED广泛使用的方式,然而由于缺少红光成分导致器件的显色性较差、相关色温较高。另外一种方式是通过在In Ga N蓝光芯片上涂覆红绿蓝三色荧光粉制
学位
人类文明的持续发展离不开能源的支持。半导体光催化剂可以实现太阳能到氢能的转化,被视为解决发展能源消耗和环境矛盾的有效策略之一。但是目前关于半导体催化剂研究的报道中,大多数催化剂的光催化产H2性能都还较低。其中,石墨相氮化碳(g-C3N4)因制备工艺简单,具有和石墨相似的结构,属于二维层状材料,同时还具有一定的可见光吸收以及优异的物理化学稳定性而吸引了一大批学者的眼光。但是纯的g-C3N4因为在制备
学位
视觉问答任务是根据一张给出的图片和一个与图片相关的文本问题,输出问题对应的正确答案的一个新兴人工智能研究方向。作为一个结合计算机视觉与自然语言处理研究的交叉问题,包含多模态输入处理和多模态特征融合的特性使得视觉问答技术在跨领域的应用上也具备了广阔的发展前景。在医疗领域,临床医生在给患者诊断疾病的时候,除了自身具备丰富的先验知识外,还会利用一些计算机辅助技术来进一步确诊患者的病情,医疗领域的视觉问答
学位
作为一种新颖的极端条件材料制备方法,高压合成有着很多常压合成无可比拟的优点,在新材料和新物性的开发探究方面具有独特的作用。目前对于物质的研究大多局限于常规压力下,而一些只有在高温高压下才能产生的晶体结构、化学反应和特殊性能等情况的研究相对较少。四钙钛矿氧化物因其结构和交换作用的复杂性而表现出新颖有趣的电学和磁学性质,如晶间电荷转移、超高居里温度、半金属性、室温巨介电等,但该结构中八面体的严重倾斜使
学位
随着互联网技术的发展,社交网络媒体已经成为社会大众获取信息的主要途径,其具有实时动态的特性,可以便捷高效的传播各种信息,从而广泛影响着社会大众。与此同时,虚假信息利用社交网络媒体传播扩散的现象也日益凸显,对社会秩序和社会经济的危害也日渐加深,因此,对虚假信息的自动检测已经引起普遍关注。针对虚假信息的检测,目前主流研究方向之一是基于深度学习设计算法,利用深度学习设计算法能自动提取信息特征,并进行细化
学位
近年来意识相关问题得到了越来越多的重视,而研究意识下视觉的加工机制则是更好地理解意识问题的前提。连续闪烁抑制(continuous flash suppression,简称CFS)范式是2005年以来,科学家在双眼竞争的基础上进一步发展出的一种更便于操作的用于意识下视觉认知研究的重要方法。由于CFS范式问世时间较短,仅仅十余年,关于CFS范式本身的研究也在经历由浅入深的过程,所以针对于其本身的研究
学位
近年来,以锂离子电池(LIBs)为主的二次电池在储能领域中得到了十分广泛的应用。然而,金属锂的稀缺以及有机电解液易燃易爆的特点限制了锂离子电池的发展。相比于有机电解液的锂离子电池,水系可充电锌离子电池(AZIBs)由于其具有安全性、廉价性以及更高的离子导电率备受关注,有望在固定储能方面成为锂离子电池很有前途的替代品。然而,在AZIBs使用中正极材料面临着允许二价锌离子嵌入/脱出的严峻挑战,因此对正
学位