异质图网络算法研究及应用

来源 :广东技术师范大学 | 被引量 : 0次 | 上传用户:yyn_8305112002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异质图适合描述具有不同类型实体和关系的现实世界数据,有效扩展了网络的概念。异质图神经网络作为一种新型技术,用来捕获异质图中的异质信息,能够有效地将消息传递机制和异质图中复杂的语义结合起来,在异质图挖掘领域取得巨大成功。然而,异质图本身存在一些通用问题,例如:无初始特征问题和节点度数的长尾问题等。知识图谱是异质图的一种特殊情况,基于两者提出的图建模和图表示方法却鲜有交叉,这是值得关注的方向。专利知识图谱能够建模大量专利间的交互,利用异质图技术分析专利知识图谱也面临着专利特征缺失,长尾等通用问题。针对上述挑战,本文对异质图神经网络的关键技术开展深入研究。首先,研究异质图的两个关键的通用问题,即特征缺失和长尾问题,分别设计相应的异质图神经网络进行解决。其次,研究了融入异质图语义的专利知识图谱构建方法。最后,进一步探究了异质图神经网络在专利知识图谱中的应用。综上,本文的主要研究内容及创新点如下所示:(1)针对如何为无初始特征或难以生成特征的异质图生成高质量的特征问题,提出异质图神经网络的位置编码(Position Encoding for Heterogeneous Graph Neural Network,PE)。具体来说,使用图嵌入获得节点拓扑嵌入,以节点间的拓扑关系为指导,计算子图中节点之间的位置,并将位置信息编码为特征作为初始特征或附加特征用于后续的节点聚合。本研究是一个异质图通用框架,易于与现有的优秀异质聚合模型相结合。在三个基准数据集上进行的大量实验表明提出的异质图神经网络框架的优越性。(2)针对异质图中节点度数的长尾问题,设计了长尾节点信息补全的异质图神经网络(Heterogeneous Graph Neural Network with Tail Node Completion,HGNNTC)。具体来说,执行节点内容转换将异质节点投影到同一特征空间,然后学习目标头节点的丰富异质邻域生成全局关系,对头尾节点进行对比生成额外信息用于尾节点聚合。本研究也是一个异质图的通用框架,易于与任意的异质聚合模型相结合。在两个基准数据集上的广泛实验表明提出的异质图神经网络模型在尾节点分类任务的有效性。(3)针对专利数据的海量属性及孤岛特性,提出融入异质语义的专利知识图谱构建方案。首先对从专利数据库中采集的专利数据进行多步骤清洗。其次引入异质图语义规则,以专利为中心设计了专利知识图谱的本体。基于定义好的本体,将清洗好的数据映射成实体和关系,存储在图数据库中,实现专利知识图谱的构建。最后基于构建的专利知识图谱抽取专利异质图,使用提出的异质图神经网络对专利知识图谱中的专利执行高效率高准确率的分类应用。
其他文献
为了适应地球自转和公转带来的日夜和四季节律变化,植物控制节律的生物钟基因在应对自然环境变化维持其健康生长发育,发挥重要的作用。生物钟基因通过负反馈调节机制精密调控植物环境适应性,PRRs家族基因是生物钟核心振荡器的主要组分,在植物光周期控制开花途径中发挥重要调控作用,同时影响抗逆性和产量,但其作用尚不够清晰。本研究利用CRISPER/Cas9技术产生的OsPRR家族基因(OsPRR1、OsPRR3
学位
词汇学习在高中英语学习中占有重要地位。很多高中生在词汇学习方面付出了很多时间和精力,但效果却常常不甚理想。国内外已有研究表明,词汇附带学习是增长词汇的有效方式。但是关于EFL学习者尤其是高中英语学习者的词汇附带学习策略,即词汇附带学习方式和附带词汇加工策略使用情况的研究较少,需要深入研究。本研究从词汇附带学习角度出发,通过对高中生词汇附带学习方式和附带词汇加工策略的使用情况进行问卷调查,旨在回答以
学位
优良玉米组合DN98×R1作为一种粮饲兼用型玉米,在生产上种植多年,具有产量高,适应性强等优点,但也存在生育期长、抗性一般、收获期含水量高等缺点,为此特引用11份南美群体对DN98×R1的主要缺点进行改良。本试验采用裂区试验设计,2020年秋在武汉,用两个测验种(母本)DN98、R1分别与11份群体(父本)组配两组共22个顶交组合。2020年冬在海南,两个测验种与顶交组合组配22份三交组合以及对照
学位
玉米是全世界最重要粮食作物之一,也是基因组研究的模式植物之一。一系列玉米自交系(如B73、Mo17等)基因组参考序列的发表,对玉米的基础研究起了重要的推动作用,也为玉米的遗传改良提供了重要的基础数据。不同玉米品系之间具有大量的单核苷酸多态性、小的插入/缺失和结构变异,这些遗传变异与重要性状的表型差异关系密切。高质量和代表性的玉米参考基因组,对玉米遗传多样性研究和品种改良至关重要。借助植物组织培养和
学位
油菜作为我国重要的油料作物,其成熟期易倒伏的现象较为普遍。倒伏导致油菜的产量和品质显著降低。而半矮杆油菜不仅抗倒伏性、耐肥性显著提高,同时产量也显著增加。因此,适度降低株高已经成为油菜的重要育种目标。近年来油菜育种工作者已经创造出一些矮杆油菜突变体,并且揭示了其中一部分矮杆形成的分子机理。进一步筛选创造具有生产应用价值的矮杆突变体,并开展其矮化机理的研究,将有助于油菜的矮化育种。本研究以来源于中双
学位
水稻是我们赖以生存的主要粮食,种子活力水平是判断种子质量的重要因素。传统检测种子活力的方法太过于繁琐,因此,需要探索一种新型有效、快速、无损的方法鉴定种子活力。近红外技术与高光谱技术是近年来较为成熟的新兴技术,能够有效判别种子的活力。本研究利用近红外光谱和高光谱技术,结合线性回归与随机森林建模分析,分别对不同贮藏条件下不同水稻品种进行活力测定。以实际发芽与否为基准,结合生理生化指标测定,再融合近红
学位
学业自我效能感与学习投入是影响学生学习成绩的重要因素。科技的快速发展推动了教育的改革,很大程度上增强了教育资源的公平性。在外界条件趋于相同的背景下,学生的自我效能感就成为影响学生学习投入的关键因素。自我效能感主要是指学生个体对自己能否凭借个人力量独立完成某项任务而进行的自我判断或推定。学生在学习上投入的精力、时间、情感都会对最后的学习结果产生关键的影响。衡量学生学习状态的关键因素还是取决于他们的自
学位
G蛋白由α、β和γ3个亚基组成,参与感受和响应外界环境,直接或间接地调控种子大小,因此深入研究G蛋白互作调控、表达模式,可为小麦分子育种奠定基础。本研究采用比较基因组学,克隆了水稻DEP1、dep1基因,构建超表达载体转入扬麦158;构建Ta DEP1的基因编辑载体转化Fielder;构建扬麦158整个生长发育阶段的酵母文库,用于筛选Ta DEP1的互作蛋白,并设计特异引物进行基因克隆及功能验证。
学位
指令语是教师话语的重要组成部分,对于教师而言,指令语的使用直接关系到教师的教学目标是否能顺利实现,教学内容是否能顺利完成;对于学生而言,它关系到学生对教学内容是否能理解与掌握,能否顺利完成手头任务。本研究以惠州一中东江学校的三位新手教师和三位专家教师为研究对象,主要调查和探讨以下两个研究问题:第一,初中英语教师对于指令语的使用现状是怎么的?具体包括:初中英语课堂中,教师指令语的有效性、使用数量、语
学位
油菜是世界上重要的油料作物,田间杂草会严重影响油菜产量。油菜生长的田间环境存在多种杂草,包括单子叶和双子叶杂草。因此,油菜地在喷施除草剂时对化学除草剂的种类及剂量有严格的要求。普通的选择性除草剂只能针对单一或少数种类的草害。草甘膦作为非选择型灭生性除草剂代表,因其高效、低毒、低残留等优点受大众欢迎。目前我国尚未拥有自主知识产权的耐草甘膦除草剂油菜品种,因此研发耐除草剂转基因油菜意义重大。IsEPS
学位