信息系统领域学术知识图谱的构建与应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:lsyuanxue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术论文凝聚着学者们优秀的研究思想。但是在当前海量论文数据、信息过载的情况下,如何充分挖掘论文中隐藏的知识,为论文的检索增加更丰富的语义信息,如何帮助科研人员快速、高效地获取所需的学术论文,是一个巨大的挑战。学术知识图谱结合推荐技术可以解决上述问题。随着谷歌公司将知识图谱用于检索,已出现很多优秀的学术知识图谱,如Ace KG等。但是这些大规模知识图谱多集中于通用和计算机领域。信息系统领域与计算机领域虽有交叉但是侧重点不同。因此,本文聚焦于信息系统领域,构建学术知识图谱,并基于此图谱进行论文的检索和相关推荐。首先,定义了信息系统学术知识图谱的数据模式,采用自顶向下的方法构建信息系统学术知识图谱,增加了“研究方法”这一语义实体。训练了Text CNN模型对论文的标题和摘要进行“研究方法”的分类,与SVM对比验证了模型的有效性。其次,在关系补全方面,通过LDA主题模型表示论文,结合定义的元路径规则,通过计算相似度补全论文的相似性关系;利用Trans H模型表示图谱中的实体和关系,与Trans E模型对比效果良好;基于论文间的相似关系来补全作者间的相似关系。最后,基于构建的知识图谱搭建了上层应用系统。基于Elastic Search实现了论文检索,基于补全的论文相似关系和作者相似关系在论文详情页展示相关推荐,基于D3.js实现了学术论文知识图谱的可视化。本文研究了信息系统领域学术知识图谱的构建和应用。搭建了服务于信息系统领域研究人员的论文检索和推荐系统,同时,也为其他领域知识图谱的构建提供了参考。
其他文献
5G传输网需要基于现有的4G传输网进行演化。在演化过程中,由于基站升级和人们对网络需求的增长,传输网中的部分节点接入流量过大,导致包含该类节点的接入网负载过高,使整个传输网络出现负载不均衡问题。在这种情况下,改变现有基站之间的拓扑连接关系,将高负载网络中的节点让渡给低负载网络,是一种成本较低、耗时较短的网络负载均衡优化方法。本文为了解决负载不均衡问题,研究拓扑优化算法来充分探索拓扑解空间,并且为了
中速磁浮作为一种运营时速200km/h的市域交通方式,主要服务于都市圈内部以及市郊范围通勤客流,在“十四五”规划建设阶段具有广阔的发展前景。列车运行图是沟通运输供给和运输需求的重要桥梁,为达到高效、节能的运输目标,本文将针对中速磁浮列车运行图优化问题展开研究,主要研究内容如下:(1)面向多目标的中速磁浮列车运行图优化问题分析。探讨中速磁浮内部各系统之间的耦合关系,分析客流需求特性和磁浮列车运行特性
随着经济的发展和维护国家安全的需要,在军事领域中对现代化战斗机或侦察机等飞行器的启动过程中的机动性、可控性等要求也在日益加强。在各种飞行器起飞方式中,电磁弹射与传统液压气压弹射方式相比具有出口速度高、可控性好、准备周期短等优点,是现有起飞方式中最具有优势的。直线电机作为电磁弹射系统的核心部分,直接对弹射目标提供推力。但传统常导直线电机相对于超导直线电机存在着推力密度较小、重量相对较大等缺点,限制了
随着科学技术的不断发展,轨道交通行业也进入新的发展时期,作为列车牵引传动控制系统的核心组成部分,牵引控制单元(TCU)的设计与研制是十分关键的技术。近年来,随着高速列车故障预测与健康管理(PHM)研究的兴起,对列车牵引控制单元的功能提出了高速数据通信和大容量数据存储等功能要求。对这两方面进行深入的研究,对轨道交通行业的智能化和数字化提升有重要价值。本文基于混合动力动车组项目,设计了一个同时具备大容
随着我国铁路桥梁建设的发展,减隔震技术的应用越来越广泛,其中铅阻尼器技术有较好的发展前景。目前有关铅芯和高性能材料组合的复合式阻尼器研究较少。本文依据连续梁桥受力特点,将铅芯同高性能材料聚氨酯结合,提出了适用于连续梁桥的新型铅芯阻尼器,并利用数值分析方法系统地研究了其减隔震性能和应用于连续梁桥的减隔震设计方法以及减震效果,主要研究内容如下:1、分析了铁路连续梁的减隔震设计需求,确定了适用于铁路连续
铁路运输是交通运输体系的重要组成部分,其安全性和可靠性至关重要。轨道电路是铁路信号系统中的重要组成部分,扼流变压器作为轨道电路中强弱电的结合部分,不仅能提供牵引电流的回流通道,还具有抑制牵引供电系统产生的不平衡电流干扰的作用。然而,一方面,高速铁路扼流适配变压器结构复杂、工作环境恶劣、故障位置隐蔽,另一方面,高铁线路封闭,仅有短时间“维修天窗”,一旦故障发生,查找和维修的时间较长,仅凭维修人员的经
本文主要来自于本人在小红书公司的实习项目。该项目基于用户的行为序列、用户画像、笔记画像以及上下文情景,预估用户感兴趣的笔记并完成召回(推荐系统的一部分,为用户粗选一部分待推荐的物品)。平台出于商业化的考量,会在笔记中嵌入信息流广告,因此召回的笔记既要满足用户的喜好,又要最大化平台的利益。本文的主要工作在于笔记推荐系统中的召回阶段,主要是以向量化召回为方式的研究工作。由于召回阶段面对的候选集庞大且对
首都城市中轴线作为一种文化遗产,具有非常悠久的历史。不论是东方还是西方城市,首都的中轴线空间通常是在一个国家发展规划的指导下形成的,因此其轴线空间反映了这个国家的规划设计理念,中轴线被赋予了历史文化层面的意义和政治经济层面的意义,是一个国家的典型标志。北京和华盛顿中轴线都通过高低起伏、错落有致的手法布置大量空间节点,营造出气势恢宏的空间结构。两个城市的中轴线都经历了形成——发展——破坏——复兴的过
随着5G与物联网的快速发展,边缘计算在现实应用中发挥着越来越重要的作用。边缘节点通过采集大量的用户数据为用户提供了丰富的个性化服务,但同时也存在着泄露用户隐私信息的风险。另外,因为用户对数据有不同的隐私保护需求,在云计算中对多级隐私数据进行有效统计成为一个难题。因此,如何保证用户的个性化隐私需求以及充分利用多级隐私数据进行有效估计成为了云边协同计算场景中的热点问题之一。本文介绍了目前常见的隐私保护
习近平总书记在中央财经委员会第九次会议上,强调要构建以新能源为主体的新型电力系统,这意味着新能源发电将代替传统火力发电成为主要能源。“十三五”期间,我国风电和光伏发电平均每年新增装机容量为0.72亿千瓦左右。随着新能源并网容量不断增加,新能源出力超出系统调节范围,出现新能源弃电现象,并且新能源固有的随机性和波动性也影响电网安全稳定运行。我国新能源装机与负荷呈逆向分布,局部地区新能源消纳条件不足,通