面向权威报刊的知识图谱构建及应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ersand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展和国外局势的日益紧张,人们对于权威报刊新闻热点的关注度越来越高,然而传统的新闻报刊已经少有人问津。相比冗余复杂的权威报刊信息,知识图谱以其结构化、网络化的特点,能够更好地满足人类获取权威报刊信息的感官体验,满足用户快速获取新闻间关系的需求。当前广泛应用的知识图谱主要有金融、医疗、旅游等领域。由于报刊新闻信息的关系复杂,因此市面上权威报刊领域的知识图谱还很匮乏。针对以上背景,本文通过对权威报刊的传播影响力和热点关注度进行研究,选定并构建了纽约时报权威报刊库,自主标注了权威报刊领域数据集,搭建了基于权威报刊领域的实体关系联合抽取模型,构建了权威报刊知识图谱,设计了基于Web的权威报刊领域知识图谱的检索推荐平台。具体内容包括:(1)权威报刊知识库的选取与构建。本文基于网站点击量、分享量,报刊发行量,传播与影响范围等,对报刊传播影响力进行研究,确定了报刊选取范围。利用分词和实体识别技术,强化检索和抓取“宗教、政治、经济、法律”等热点词汇进行词频统计,得到不同报刊的热点关注度。通过热点词汇的词频统计对选取范围内的权威媒体报刊排序。最终选定纽约时报为本文的目标报刊。为了构建权威报刊知识库,本文针对纽约时报新闻网的规则和实验过程中遇到的反爬虫机制,基于网络爬虫技术设计了一个权威报刊知识爬取器。以此为工具进行权威报刊知识的获取,构建权威报刊知识库,为图谱构建提供数据支撑。(2)权威报刊领域知识图谱的构建。本文对于知识图谱构建需要的关键技术即知识抽取、实体对齐和知识存储进行了研究与实现。本文设计了基于BERT语言模型的实体关系联合抽取模型。通过自主标注训练集的方式,定义了的权威报刊知识图谱实体10种,关系类别9种。构建了包含72569个实体,327883个关系的权威报刊知识图谱。同时,针对一个语句中含有多个三元组的情况,本文采用指针结合标注的思想应用到权威报刊知识抽取模型中。针对语义歧义的实体,本文提出了一种Dice和编辑距离联合算法用于实体对齐,优化图谱效果,避免实体歧义。最终将得到的三元组信息通过Neo4j进行知识存储。(3)基于Web的权威报刊知识图谱检索平台。基于本文构建的权威报刊知识图谱。利用Python的Flask库搭建Web网页框架,利用Elasticsearch搭建搜索引擎。并通过Flask后台开发框架、Echarts图形可视化框架、BootStrap前端可视化框架等技术的交互设计,搭建了权威报刊领域的知识图谱检索推荐平台。该平台集成了权威报刊图谱可视化、权威报刊图谱检索、权威报刊智能推荐、权威报刊图谱扩展、权威报刊时间轴动态调整等模块。能够满足当前社会上对国外权威报刊新闻获取的需求。
其他文献
随着知识图谱在学术界和工业界的广泛研究和普遍应用,完善与更新知识图谱数据,提升知识图谱质量成为亟不可待的任务,知识表示学习作为知识图谱补全重要的上游技术越来越受到人们的关注。知识表示学习的目标是将知识图中实体和关系嵌入到向量空间中,使它们的语义关联以可计算的形式更好地表达。知识表示学习广泛应用于实体/关系预测与补全等场景。大多数知识表示学习模型基于图结构本身的实体/关系信息,如翻译模型、卷积/图神
学位
视觉目标跟踪是计算机视觉的基础研究问题之一,被广泛应用于智能交通、自动驾驶和安防监控等领域,具有巨大的社会和经济价值。深度学习在计算机视觉领域的成功极大推动了目标跟踪技术的发展,其中基于孪生网络的目标跟踪算法将跟踪任务转化为图像间的相似性匹配过程,兼具实时性和准确性而备受关注。由于遮挡、干扰物和视角变换会导致目标外观特征不稳定,而孪生网络跟踪方法仅根据初始帧目标来匹配后续图像,难以有效区分干扰物和
学位
随着3D传感器的技术发展,众多3D点云相关的计算机视觉任务应运而生,其中3D场景理解任务面临着众多挑战。在过去的几年中,使用深度神经网络对点云进行3D目标检测和场景分类逐渐成为主流方法,然而传统神经网络只通过形状特征来辨别物体和场景,未考虑到物体与场景之间的关联性。本文通过贝叶斯神经网络的方法,为3D目标检测赋予预测不确定性的能力,通过贝叶斯信念网对场景进行推理,并对目标检测的结果合理性进行验证,
学位
轴承是旋转机械的核心零部件,其健康状况直接影响机械设备的整体运行。航空发动机主轴轴承一般工作在高温、高速、重载的严苛工况下,作为传动关节的主轴轴承很容易受损,轴承一旦受损将导致发动机效能下降,甚至造成严重事故。因此,对航发轴承进行故障诊断与预测可以降低维修成本,优化资源配置,确保设备正常运行。目前,现有的轴承故障分类神经网络模型只适用于固定转速和载荷的情况,在转速时变、交变载荷的情况下其诊断性能急
学位
目标检测是机器视觉的基本任务之一,其主要目的是识别场景中的特定目标类别,并确定目标边界框的位置。如今,由于硬件设备的不断升级,大量视频数据被生成,视频目标检测技术在车辆自动驾驶、互联网视频审核、安防监控数据审核回溯等领域有着巨大的应用潜力,因此视频目标检测技术研究对于实际工程应用具有重大意义。近年来,随着深度神经网络在各领域取得的成功,基于深度神经网络的视频目标检测技术的精度和效率取得了突破性进展
学位
以某医院建设工程项目作为研究案例,对高大梁模板满堂脚手架施工技术进行深入研究,先确定搭设方案,再进行受力计算,最后详细阐述施工技术要点,并简要介绍了大梁模板的监测方法。经研究得出结论:建筑工程施工过程中,高大梁模板支撑架施工具备危险性,稍有不慎就会导致安全事故的发生,所以,在对其进行施工时必须对施工技术的选择予以重视。
期刊
随着视频采集技术和采集设备的快速发展,单相机获取的视觉信息内容单调、角度单一已经无法满足人们对于沉浸式视觉体验的追求,相机阵列技术作为计算机视觉领域中一个重要的发展方向已经被广泛地应用到体育赛事、智慧安防等多个领域。本文针对大场景下现有相机阵列视觉区域受限的问题,结合篮球赛事场景中动态目标自由视点视频生成的需求,提出了一种主从式云台相机(Pan-Tilt-Zoom Camera,PTZ Camer
学位
三维GIS是数字孪生城市可视化的基础平台,与监控视频实时融合能实现对物理城市运行状态的精准映射,已成为新一代智慧城市发展的关键技术。然而由于视频图像与GIS数据接口的无关性,导致海量视频时空信息难以融入GIS中充分表达。本文聚焦于视频时空数据在三维GIS中的准确、高效融合,为了满足视频与三维GIS融合中时空信息一致、系统稳定流畅的需求,研究了基于场景信息的视频相机注册方法与基于轨迹提取的视频GIS
学位
准确可靠的农作物分类信息是农情监测和粮食安全评鉴研究的重要数据来源,遥感技术的快速发展为农业信息的获取提供了极大的技术支持。极化合成孔径雷达(Pol SAR)是一种主动微波遥感系统,具有全天时、全天候的对地观测能力,可以为农作物分类提供丰富的信息。然而单时相的雷达数据无法完整地反映农作物生长过程中的形貌变化情况,具有一定的局限性。此外,相比于光学数据,雷达图像的解译往往比较困难,而光学遥感可以获得
学位
当前,互联网技术蓬勃发展,“互联网+教育”的教学模式逐渐进入了人们的视野,伴随着各种线上教学系统的出现,传统教育模式的壁垒逐渐被打破。随着微信小程序的兴起,人们能够更加方便快捷的访问各类应用平台,教辅系统与小程序的融合也将成为必然趋势,因此设计一款课堂测试微信小程序,将课堂上的签到、测试等环节迁移至线上进行,不仅能够节约课堂时间、减轻教师压力、提高学生的积极性,也能够及时的获取反馈,从而达到检验教
学位