面向专业领域文献的知识图谱构建与应用

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wybyoung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于科研工作者而言,专业领域文献是他们在日常学术研究过程中使用最多、最频繁的资料。在科研大数据时代,面对亿量级的文献资源,科研工作者很容易陷入海量文献的泥潭中。知识图谱作为知识经济下的新兴技术,可以从语义角度结构化地描述文本中的实体以及实体之间的关联。因此,将知识图谱应用至科研学术领域,构建专业领域文献知识图谱,描述知识骨干网络,这对科研工作者具有很大的价值。本文设计了专业领域文献知识图谱的整体构建框架,以机器学习领域文献为例,从模式层与实例层入手对该框架进行了具体实现,并基于构建的文献知识图谱进行相关科研应用。主要取得了以下研究成果:首先,本文在领域文献特征分析的基础上,对垂直领域知识图谱一般构建过程进行改进,提出了适用于专业领域文献的知识图谱构建框架。该框架包含了专业领域文献知识图谱构建的总体流程以及每一步所采用的关键技术。其次,针对知识图谱模式层的构建,本文采用自底向上的方式,在机器学习领域文献术语聚类结果的基础之上结合学者对文献的需求,确定了模式层的四大实体类型、实体间五大关系类型。此种确定模式层分类体系的方式可一定程度上解决当前研究中对于领域专家知识过度依赖的问题。再次,针对知识图谱实例层,本文构建了基于长短期记忆网络与条件随机场的知识实体识别模型以及基于注意力机制的关系抽取模型,并分别通过实验验证了模型的有效性。最后,采用图数据库存储实体与关系,形成专业领域文献知识图谱,并基于构建的知识图谱提供了文献标注与知识发现两个应用示例,可实现文献重点标注、研究点搜索与格式化综述的功能。本文进行面向专业领域文献的知识图谱构建与应用的研究,从理论上,在对垂直领域知识图谱的构建过程进行适应性改进的基础上完整地构建了领域文献知识图谱,进一步丰富和发展了知识图谱的研究。在实践上,基于领域文献知识图谱的相关应用将隐含在非结构化科研文献中的知识显性化展示,可提高科研工作者文献阅读效率,帮助学者更快地了解领域研究现状。
其他文献
当前,随着人民生活水平的不断提高,人们在物质生活提高之后,自然就会开始追求更好的精神生活。这时作为社会公共文化设施一部分的社区图书馆就开始在满足社区居民文化需求方面起到了越来越重要的作用。但是由于政府机构在社区图书馆的经营中,存在着经营管理理念上的落后,缺乏足够重视等问题,为了弥补这些问题,让社区图书馆更好地发挥社区居民“第二起居室”的作用,同时也为了减轻政府机构自身的负担,这就产生了政府向社会力
氧化锌(ZnO)由于成本低、无毒及强光敏性和优异的光学、物理和化学性质引起了人们的关注,目前已在太阳能转换和环境污染物处理等领域进行了较为深入的研究。但是太阳光的利用率较低,所以拓展可见光的吸收成为亟待解决的问题。多孔ZnO由于其发达的孔道结构利于污染物和产物吸附和扩散,所以在光催化污染物降解时可以产生更多的表明活性位。因此,调控多孔ZnO带隙及表面缺陷以实现其可见光的有效吸收同时提高光生电荷的分
在新媒体时代,社交媒体作为信息交流的平台,大量用户在网络平台上发表自己的言论和对信息进行传播。企业发生危机事件后,除了要面临危机事件本身还可能要处理随之产生的重大舆情危机。此外,有关该危机事件的谣言也可能随之出现并对企业造成严重损失。因此,企业如何有效的应对解决此类危机舆情和可能产生的谣言传播变得十分重要。为了给企业危机舆情应对提供更好的建议,本文就企业危机舆情的传播特征和重复传播现象进行研究。首
人体行为识别是计算机视觉领域的重要研究课题,在医疗监护、智能家居、虚拟现实、人机交互、智能安防、基于内容的视频检索、运动员辅助训练等领域具有非常广阔的应用前景。传统的人体行为识别方法通常不考虑视角变化的影响,它假设在训练和测试期间视角是相同的。而在实际情况中,视角通常都是变化的。当视角变化过大时,这些方法的识别准确率将显著降低。本文主要研究跨视角人体行为识别问题,在该问题中模型的训练和测试是在不同
进入新常态以来,中国在经济发展的过程中更加注重质量。然而,体制机制不健全在一定程度上制约了宏观经济发展质量提升和微观企业主体经营绩效改善。在制约宏观经济发展质量和微观企业主体经营绩效的机制中,公平竞争机制不健全是其中重要的一方面,缺乏健全的公平竞争机制,将使得市场竞争难以有效进行,整个市场效率相对较低,企业绩效难以得到有效提升。近年来,为推进经济结构转型升级和经济发展动能转换,国家持续推动市场化机
加入世贸组织以来,中国对外贸易发展迅速,逐渐成为货物贸易世界第一大国。与此同时,一方面巨大的能源消费为经济和贸易发展提供动力支持,另一方面,能源供需矛盾,不合理的能源消费结构,低水平的能源利用效率等能源问题又反过来成为制约经济和贸易进一步发展的主要因素。因此,研究对外贸易开放对能源消费增长的影响机制具有理论和实际意义。本文选用2006-2015期间中国285个地级及以上城市数据,运用分解分析方法将
随着中国互联网行业的快速崛起,出于对便捷生活的需求,各种智能化设备获得了空前发展,与此同时也导致无线通信所依赖的频带出现了资源紧张的问题。由于互联网应用的多样化,对现有的通信速率提出了新的挑战。截止到2019年全国大部分地区都开始了第五代移动通信(5th-Generation,5G)的商用测试,但是5G只能解决当前通信遇到的部分难题,仍需通过下一代通信技术的不断研究寻找通信发展的新方向,这对未来的
随着生活水平的提高,城市汽车购买量越来越多,堵车和空气污染在现代都市生活已是司空见惯,这就迫切的要求我们采用更加高效环保的交通工具,双轮自平衡车具有轻便灵活,速度快,环保节能的优点,而且它也很好的解决了人们的近距离出行问题,同时也具有很高的娱乐性,在生活中越来越受到人们的青睐。但是目前市场上的的双轮自平衡车应用还有一定的局限性,首先它对道路环境的要求较高,在一些复杂路况的道路环境中,还不能看见它的
随着遥感技术的快速发展,各类遥感卫星传回的遥感图像分辨率越来越高。因遥感图像携带信息越来越多,故从遥感图像中识别典型目标成为可能。其中,机场区域作为重要的大型人造目标,对其识别一直是遥感图像识别领域重要的研究方向之一。机场区域面积较大,因其独特的功能,使得机场区域远离城市中心。为了准确从大场景遥感图像中识别机场区域,本文以遥感图像预处理方法为基础,依据机场区域纹理特征,采用改进最大类间方差法对遥感
近年来,随着人造卫星的发射,遥感技术开始应用于气象观测,地理测绘,城市规划,资源环境监测等多个领域。通过遥感技术,人们可以解译遥感图像从而获取图像中的信息加以利用。但是由于受地理环境影响,太阳光线在传播过程中被山川树木或者城市中的高大建筑物等地物遮挡从而形成阴影。阴影的存在有利有弊,一方面,我们可以利用阴影对城市中建筑物进行估算高度或者形状等操作;另一方面,阴影的存在会导致遥感图像中阴影区域的信息