基于网络新闻的知识图谱构建与研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:langya925
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于Web2.0时代的到来,互联网从信息共享时代步入了信息共建时代,网络新闻的迅速发展极大的改变了人们在生活中获取新闻信息的媒介和习惯。在大数据时代的今天,我们要对互联网上日益递增的新闻数据进行高效率的全网检索常常都会因其海量、高复杂性、非结构性的特点而受阻。为了提升用户与互联网之间的互动体验,实现更高质量检索,最终实现能够预测出互联网用户所需信息的目的,知识图谱便应运而生。本文在爬取到的网络新闻数据基础上提取了单一主题新闻中的实体,通过算法调整实体关系网络各个实体之间的关系,从而构建各个新闻事件下的知识图谱。首先对获取到的原始新闻数据进行简单的处理,获得初步的实体和相关关系,然后基于初始关系网络的三元封闭原理,建立了实体间“稳定”这一关系的概念,并计算每条边的“稳定”占总图中的“稳定”比例,以此为依据建立评估实体之间关系的权重的指标。再使用优化的Kruskal算法来获得部分主题新闻的知识图谱,本文中称为基础型知识图谱(Basic Knowledge Graph,后简称BKG)。针对相同的新闻事件,在不同媒介和不同时间点抓取到的数据,可构建出实体种类相异的BKG,而由于不同的新闻数据所报道的是同一事件,这些BKG中必然包含有相似度极高的实体,然后利用大量相似度极高的实体对得到的BKG进行图谱融合,从而得到一个主题下综合的知识图谱。本文通过对上述方案,最终可以将获取的真实新闻文本数据有效的构建成网络新闻数据下的知识图谱。通过实验效果的评估,保证了所采取的构建方案的有效性和可靠性。因此,本文所研究的内容对新闻领域的知识图谱的构建具有一定的实用价值。
其他文献
目前,全球范围内建筑业面临高耗能、高污染的问题,我国尤为严重,建筑业能耗高、全球变暖、雾霾严重的问题限制着我国经济的发展、社会的进步,基于此,被动房这一新型节能建筑应运而生。被动房是目前兼具超低能耗性能以及高舒适度居住体验于一体的科技节能型建筑,大力开发被动房是我国降低建筑能耗、实现节能减排战略目标的重要途径之一。被动房在我国发展起步相对较晚,各地区的发展不一。尽管政府方在积极推广绿色建筑、节能建
随着后金融时代国民经济的逐渐发展,技术创新已然成为发展我国经济的核心因素。其中,作为可以进行自主创新也可以进行创新成果转化的主体,企业凭借其独特的天然的产业化优势,成为了研究创新绩效的主要对象。而大中型工业企业又是我国国民经济支持的重要支柱,从一定程度上来说,其大量的科技创新活动的创新效益水平走势能够反映全国工业企业创新活动效益水平的发展趋势。因此,如何看待我国大中型工业企业创新要素资源联动效率的
随着移动通信技术的快速发展和移动电话的普及,运营商短消息业务己经具有十分庞大的业务量。但是,与此同时不良短信的泛滥也日趋严重,由此而导致的居民财产损失、个人隐私泄露等事件时有发生。因此对不良短信进行有效治理具有重要意义。针对短信文本特性稀疏、噪声大的特点,本文提出基于深度学习的DBiGRU-Atten模型对不良短信进行识别。DBiGRU-Atten模型能够通过深度神经网络自动提取短信文本的高阶特征
云计算是一种新型的计算存储方式,用户不需要掌握专业的技能,只要按照自己的需求付费就可以享受便捷的网络服务。我们在使用云服务时,需要将数据上传到云服务器。在这个过程中,我们不可避免地面临着数据安全的挑战,如何保证云环境下数据的隐私安全成为了亟待解决的问题。云环境下数据安全隐私保护主要分为两方面,一方面对外保护数据的隐私;另一方面对内保证数据的完整。身份认证是云服务安全的第一道防线,可以有效地防止非法
随着教育信息化水平的不断提高,计算机辅助语言学习(CALL)系统在语言教学中的应用也变得更加广泛。在国内大学的英语口语考试中,教师需要对大量考生的口语录音进行人工批改,这是一项重复且消耗时间的工作。利用CALL系统实现对口语录音的自动化批改将能减轻教师的工作负担。目前这样的系统已经成功实现了对朗读型口语题的自动批改。然而,针对开放式口语题型进行自动化批改仍然是待突破的研究重点。因此,设计并实现一个
改革开放40多年以来,随着我国社会主义市场经济体系不断完善,各个行业中的现代企业制度日趋成熟。我国企业的市场份额也因此逐步显现,国内外市场地位也逐步确立。面对激烈的
量子信息科学是一门包括量子光学、量子力学等多种学科的新兴交叉学科。最近,随着人类科学技术的发展和技术水平的上升,众多理论方案在实际实践中得以实现,例如量子隐形传输、量子密集编码和量子密钥传输等。其中自1993年量子隐形传态理论方案有Bennet等人做了开创性工作以来,就引起了广大理论物理学家和实验物理学家的关注,量子隐形传态是通过局域操作和分割两地的两种纠缠粒子将不可知的粒子态以高于任何经典协议的
共情是一种人与生俱来的能力,它能够帮助我们理解和感应他人的情绪情感。共情法作为心理咨询方面的一种有效方法,正在被各个领域加以应用。将共情方法引入到历史教育领域,一方面可以在师生之间建立起一座情感共鸣的桥梁,有利于增进师生之间的沟通、理解和关怀,建立良好的师生关系;另一方面,师生通过共情于历史,可以站在前人的角度审视历史发展的轨迹,对历史的发展和演进产生更深层次的理解和更高层次的感悟,深入发掘历史的
随着互联网技术的快速发展和广泛应用,信息安全的重要性日益凸显。现代密码学是保护信息安全的重要理论基础。密钥交换协议是现代密码学最基础的密码学原语之一,能够在开放的信道上使通信双方达成密钥共识,进而进行保密通信。密钥交换协议在互联网协议、电子商务、保密通信等领域已经得到了极为广泛的应用。随着量子计算机的快速发展和量子算法的提出,基于传统数论困难问题的密钥交换协议开始面临挑战。因此,尽快部署和应用抗量
思维决定态度,态度影响行为,在这个关系链中思维方式是影响行为变化的起点。创新行为亦不例外。以往从个体视角对员工创新行为进行的研究多集中于员工的特质和动机等外显角度