基于多路复用异构网络的作者引用预测研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:gz_firefox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络,是一种由不同实体相互交织所构成的模式,能够对实体间的关系进行描述。链路预测问题,通过分析网络,针对于其历史时间段的实际情况进行研究,从而判断是否有链路存在于网络节点之间,该方法在推动网络研究的发展中发挥着重要的影响。而在学术关系的研究中,链路预测技术通过学术网络能够预测并深入发掘具有高影响力潜力的作者,而且能够更好地预测作者引用网络结构的变迁情况。以往的研究在进行网络建模时往往采取单一类型节点与连边的方式进行,对于网络中存在于实体间的不同类型信息考虑的不够全面。因此,目前的研究者们着手研究并发展异构信息网络,其广泛的运用了多类型节点和连边的方法,形成了如多路复用网络,时序网络等多种网络模型。本文通过分析当前主流的链路预测方法,发现它们存在两个问题:1)基于异构信息网络关系预测的研究其网络大都是静态的,并不包含时间信息;2)大多数链路预测方法以提取网络特征和属性为主,对于较为复杂的数据,该方法可能无法较为准确地捕获网络信息并利用其特征进行预测。为了更精准、高效地对作者引用网络进行预测,本文拟基于多路复用异构网络,同时考虑作者之间不同的关系和时间对引用的动态影响,对更多层真实的动态网络进行实验,利用深度学习“端到端”地实现对未来作者之间引用的链路预测。本研究构造了基于多路复用网络的作者引用网络预测模型,考虑作者共被引关系、作者耦合关系及作者直引(互引)关系三种类型构建多路复用网络,并对多路复用网络进行了计算和时序划分处理,考虑了多层的节点信息以及动态信息,提高了网络表达的准确性。此外,参考前人的经验,综合考虑图卷积网络(GCN)、长短期记忆(LSTM)网络和生成式对抗网络(GAN)的特点,利用这三种深度学习模型对动态加权网络进行时间链路预测。本文选取了 Aminer平台的Academic Social Network数据集进行了实验。通过使用不同指标,对本文采用算法的结果进行评估。同时,与基准算法下的结果做对比分析。实验结果表明,利用多路复用异构网络该链路预测算法可以达到较好效果,其具有更高的预测准确度。同时,本文还对比不同层的加权方式对预测效果的影响。实验结果表明,不同层的链路权重对预测结果影响较大,特别当多路复用网络考虑全部的作者耦合信息和作者共被引信息时,实验预测效果最佳。因此在进行作者引用预测时,学者可以考虑采取多路复用的方式构建异构网络,获取更多的节点信息,并选取合适的加权方式来提升预测准确度。
其他文献
目的 以文化基因理论为基础,从传统手工艺表型基因的视角对丹寨蜡染的“纹样基因”进行透析与解读,以此传承丹寨蜡染民族文化基因并进行现代包装视觉设计转译。方法 通过分析丹寨蜡染“纹样基因”,从纹样形式、图案类型、构图规律与审美意蕴等要素出发,探讨其在农产品包装设计中发挥的重要作用。结果 结合蜡染纹样的贵州农产品包装设计进一步推进农产品包装的品质升级与蜡染文化基因的广泛传播。结论 以丹寨蜡染纹样基因为背
期刊
针对轨道交通长距离用电设备常规配电方案存在造价高、电压质量差等问题,提出一种长距离用电设备直流配电技术方案,以达到提高电压质量、降低工程造价的目的。首先,结合轨道交通长距离用电设备种类多、分布广、可靠性要求高的特点,对直流配电系统的电压等级、供电容量、拓扑结构等关键技术进行深入分析。然后,对适用于低压配电领域的换流器关键参数给出设计原则和计算方法,在此基础上,提出了电压协调控制策略,以保证电压的稳
期刊
随着“互联网+医疗”服务体系的发展,公众在网络上搜寻健康信息的行为日趋频繁,尤其是在突发公共卫生事件下,公众对于健康信息的获取途径主要集中在互联网上,因此,在复杂的社会经济环境和网络环境影响下,如何从质量不一,良莠不齐的健康信息中正确区分并合理选择健康信息显得尤为重要。全面探讨突发公共卫生事件下信息搜寻行为影响因素有助于缓解人们的健康焦虑,帮助人们更好地解决健康方面的问题。2019年12月新型冠状
学位
报纸
报纸
我国的采矿行业虽然历史悠久,但现代采矿技术却还在发展中,随着人们需求的不断提高,对矿产资源的需求也在逐步提升。采矿技术的不断更新与应用,对我国的采矿业来说是机遇也是挑战。如何能在确保采矿作业安全的基础上,不断提高采矿技术水平,提高开采效率,是采矿行业重点关注的问题。本文对我国采矿技术的特点及采矿技术进行了分析,针对采矿安全问题提出了建议,对相关工作的优化提供参考。
期刊
在信息化技术不断发展所带来的数字化浪潮下,数字化阅读已经成为最普遍的阅读形式,然而,作为图书组织工作中最为关键和复杂的一环——图书分类,却在很大程度上依然保持着传统的人工分类方式。显然,在图书领域中,传统的人工分类方法显得力不从心,已经不能满足大数据时代下智慧型图书馆的分类需求。因此,有关以信息自动化为依托的图书自动分类技术应运而生,通过各种计算机技术,实现对图书资源的数字化与组织化,从而完成对海
学位
基因编辑技术是对基因组上的目的基因进行修饰的技术,通常依赖于DNA的双链断裂(Double-Strand Break,DSB),然后通过同源重组(Homologous Recombination,HR)或非同源末端连接(Non-Homologous End Joining,NHEJ)等方法进行修复。前者需要引入同源片段和重组酶,修饰准确,但是操作复杂、效率较低且会在基因组留下编辑的痕迹;后者操作简
学位
随着新型基础设施建设的发展,为能源与数据要素的深度融合提供了条件。档案数据治理作为档案治理的重要组成部分,对于推动档案学科发展与国家治理体系和治理能力现代化具有深远意义。虽然当前相关学者探究了档案数据治理的概念与特征,但国内外并未关注到在能源变革与数据要素释放的融合基础设施建设背景下档案数据所发挥的价值,也尚未构建能源档案数据治理的要素体系,一定程度上阻碍了能源企业档案数据的融合与应用。为此,本研
学位
基于城市轨道交通常规走行轨回流系统,分析了专用轨回流系统的特点,并针对接触网+回流轨牵引供电系统和供电轨+回流轨牵引供电系统,阐述直流接地漏电保护装置的工作原理。接触网+回流轨牵引供电系统直流接地保护方案在变电所直流负极与地之间设置接地漏电保护装置,在直流系统正极对负极、架空地线、钢轨、车辆壳体等各种短路故障中可实现选择性保护;供电轨+回流轨牵引供电系统采用64D接地漏电保护装置,通过一系列改进,
期刊