【摘 要】
:
传统的知识图谱关注焦点是实体、实体间关系。实体是静态的概念,事件是动态的,包含了更丰富的语义信息,表现粒度是大于实体的。事件知识图谱以泛化的事件类知识作为主要内容,可以更好的描绘事件发生、演化的发展过程,厘清事件之间发生的规律。本文在CEC2.0中文突发事件语料库的基础上,获取事件类知识和事件类关系知识,构建出事件知识图谱。并使用规则的方法,开展后续事件预测工作。研究为面向事件的知识发现、处理和应
论文部分内容阅读
传统的知识图谱关注焦点是实体、实体间关系。实体是静态的概念,事件是动态的,包含了更丰富的语义信息,表现粒度是大于实体的。事件知识图谱以泛化的事件类知识作为主要内容,可以更好的描绘事件发生、演化的发展过程,厘清事件之间发生的规律。本文在CEC2.0中文突发事件语料库的基础上,获取事件类知识和事件类关系知识,构建出事件知识图谱。并使用规则的方法,开展后续事件预测工作。研究为面向事件的知识发现、处理和应用奠定基础,也可以使用事件知识图谱中的事件演化规律,为突发事件应急决策提供支持和依据,从而减少突发事件给人们财产和生命带来的损失和伤害。本文主要研究内容如下:(1)事件类候选触发词的获取,提出基于同义词词林的词语相似度计算方法,用此相似度计算方法可以有效的对语料库中事件触发词进行聚类,从而进一步获取事件类的候选触发词。(2)事件类对象要素的获取,提出基于大词林的事件类对象要素发现方法,以大词林作为其对象到上层概念映射的知识库,对语料库中该事件类的所有事件对象进行由底向上的抽象,从而得到该事件类对象要素的上位词知识。(3)事件类环境要素的获取,提出基于依存句法分析的事件类环境要素发现方法,用依存句法分析确定环境要素的核心词,再通过频次的高低对环境要素进行聚类,得到了各事件类的环境要素。(4)事件类关系的获取,提出采用共现事件的方法判断事件类相关性,统计出具有相关性的事件类之间的发生概率,再基于突发事件语料库中已标注的事件关系映射到事件类关系,实现突发事件类关系发现。(5)事件知识图谱的可视化及应用,以事件类作为节点,事件类之间的关系作为边,发生概率作为权重,对事件知识图谱进行可视化,并且以构建好的事件知识图谱作为知识,基于规则的方法进行后续事件预测研究。实验结果表明,本文提出的事件类知识发现方法在准确率P、召回率R和F1指标下,相比其他方法有所提高。通过实验也证明提出的事件类关系知识发现方式具有有效性。构建的事件知识图谱,对未来面向事件理论研究奠定基础,也为制定应急决策方案提供事实依据,从而控制或减轻突发事件带来的伤害。
其他文献
随着人们生活质量的提升与新一代信息技术的逐步发展,人们对食品的质量要求越来越高,对食品质量信息安全越发重视。食品溯源涉及从生产到销售所有环节,涉及信息量较大,传统食品溯源系统中各环节相互独立,信息不流通,易形成信息孤岛,导致溯源过程繁杂、溯源难度大。食品溯源系统由中心化企业或者机构掌控,生产、加工、销售各环节信息全部存储于中心化系统中,易造成存储数据被人为更改、被攻击的风险,导致溯源信息不完整、不
2016年虚拟现实技术受到社会广泛关注之后,2020年又因疫情的影响热度再次上升。文章分析了国内外虚拟现实技术和应用的现状,对工程项目的约束条件和实施方案的可行性进行了探讨。以阜阳师范大学校园为主体,搭建了阜阳师范大学校园虚拟漫游系统。系统以阜阳师范大学招生宣传需求为导向,综合多种开发技术以解决不同的工程约束条件。系统基本框架基于HTML5和Three.js搭建。作为远景,以真实感为主要要求,对部
高校一直都是科研创新的重要高地和科研力量的主要集中地,其科研成果的多寡更是作为衡量高校综合实力强弱的关键性因素之一,对于高校科研成果管理平台的构建和发展应该给予高度重视。搭建一个依托于互联网平台的科研成果管理系统,为高校科研人员创造一个良好的科研环境,是功在当代,利在千秋的利好工程。通过对国内外部分高校科研成果管理系统的研究分析,结合阜阳师范大学现行科研成果管理系统现状,本课题将从科研成果管理功能
图像的数字化修复是一项依靠已知信息对图像损坏部分进行填补,并且难以被察觉有修复痕迹的技术。图像的数字化修复技术如今在许多领域都有所应用,例如旧照片裂纹修复,去除目标物的修复,古代遗迹壁画的修复等。因此,对数字图像修复技术进行深入研究,不断提高图像的修复质量具有重要研究意义。本课题以Criminisi算法与Patch Match算法为主要研究目标,总结了国内外学者针对这两类算法的研究现状,对比分析两
进入21世纪以来,互联网每天都在生产数据、创造数据和使用数据。大量的数据产生大量的信息,致使用户越来越难以从中甄别有用的信息为自己所用。推荐系统能够根据用户兴趣进行个性化推荐,满足用户需求,同时也让用户和商品之间的黏性变得越来越大。在图书推荐领域,图书推荐可以为不同的读者进行专属的推荐,满足快速而有针对性查找的需求,增加图书的阅读率和销量。本文重点对基于协同过滤和隐语义模型的推荐算法进行了研究和改
尽管视觉问答在过去几年中取得了令人瞩目的进步,但当前的视觉问答模型往往倾向于依赖训练集中的表层语言相关性,而很难推广到具有不同QA分布的测试集中。为了避免模型过于依赖语言偏见,最近的一些研究引入了一个辅助的仅问题模型,以规范化针对性的视觉问答模型的训练。CSS(Counterfactual Samples Synthesizing)作为一种与模型无关的反事实样本合成训练方案,通过掩盖图像中的关键对
在目前包括自然语言处理和计算机视觉这些研究重点领域中,视觉问答(Visual Question Answering)无疑是最热门且具有挑战性的领域之一,受到了越来越多的关注,并且具有十分重要的研究意义,通过对视觉问答的研究,可以帮助视觉障碍者了解周围的事物,回答一些关于周围场景的问题,缓解生活困难,提高人机交互的体验,使人机交互更加自然。但是给定一幅图像,回答对应问题时是问题更重要,还是图像更重要
2019年末,新型冠状病毒肺炎(COVID-19)疫情在全世界范围内爆发,人们的社交环境受到极大的影响。国内中小学及高等院校教学也因疫情原因无法按期开学提供正常课堂教学活动,使得以线上教学为主的远程授课模式成为疫情期间的各教育机构的主要授课方式。如今虽然我国的疫情已经得到了有效的控制,但在全球范围内,疫情形式依然较为严峻,因此通过线上教学的方式有效减少社交活动仍然是有效防控疫情的主要方法之一。本文
随着医疗水平的不断提高,使用机器学习方法对乳腺癌进行分类预测,已成为近年来研究热点。由于乳腺癌临床诊断数据与超声影像是诊断其类型的关键依据,因此本文对来自Biendata Competition公开数据集中乳腺癌患者的临床诊断数据和超声影像进行分析及特征融合,构建了基于决策树的分类模型对乳腺癌类型进行预判,设计与实现了分类系统。本文的主要研究内容包括:(1)乳腺癌分类模型的筛选。首先,分析了决策树
三值光学计算机(Ternary optical computer,简称TOC)想要在商业上得到一定的成就必须确保其拥有良好的服务质量,因此针对三值光学计算机的性能分析研究受到了很多其研究者的关注。然而,目前对三值光学计算机性能分析的研究中并没有考虑到优先级的问题,如何为不同的优先级用户都提供满意服务体验是需要重点思考的问题之一。文章引入了两种混合抢占优先权排队策略建立TOC任务服务模型对TOC进行