论文部分内容阅读
事理图谱与现有知识图谱有所不同,是以事件为节点,事件之间的关系为边的一种图谱。针对突发事件的特点,将突发事件与事理逻辑相结合,可以更好地描绘事件发展过程。除此之外,专家学者可以利用事理图谱快速收集事件的相关信息,并厘清事件发展的脉络,为应急决策方案提供高效的事实依据,从而控制或减轻突发事件所带来的伤害。本文根据突发事件的特点,将其分为事件发生类、事件影响类和应急决策类三类,设计并实现了一个面向突发事件领域的事理图谱平台。本文主要研究的是事理图谱构建过程中的相关技术,具体内容如下:(1)提出基于序列标注的实体和突发事件触发词联合识别的方法。采用序列标注模型对事件文本句进行实体和事件触发词的联合识别,实验表明本方法提高了事件识别的效果。(2)针对不同的事件类型采用不同的事件元素抽取方法。对于事件发生类的事件提出采用融合实体和突发事件触发词特征的事件元素抽取方法,利用实体、事件触发词和事件元素之间的依赖关系进行事件元素抽取,实验表明本方法提高了事件元素抽取的效果。对于事件发生类和应急决策类的事件提出采用基于依存句法分析的事件元素抽取方法,通过依存句法分析确定句子中的核心成分,并按照一定的约束规则抽取出包含此类事件触发词的核心词汇,此方法可以有效地抽取出事件元素。(3)提出采用基于模式匹配和神经网络相结合的突发事件因果关系抽取方法。首先,将抽取出的事件两两组队。然后,对于两个事件指向同一事件描述句且存在因果触发词的情况,采用模式匹配的抽取方法,否则,将其看作是分类问题,利用神经网络对突发事件因果关系进行分类。最后,将抽取结果组成因果事件对的形式。实验表明,本方法提高了事件因果关系抽取的效果。(4)提出基于事件综合相似度的突发事件融合方法。针对突发事件的特点,将事件影响类和应急决策类的事件从事件描述句的相似度和实体共现两个方面进行事件综合相似度的计算。事件发生类的事件从事件描述句的相似度、事件元素相似度和事件描述句实体共现三个方面进行事件综合相似度的计算。最后,利用事件综合相似度来进行事件融合。实验表明本方法可以有效进行事件的融合。(5)设计并实现了一个面向突发事件领域的事理图谱平台,并对平台的功能进行了测试。本文将事理图谱平台分为数据采集平台、数据标注平台和图谱构建平台三部分。数据采集平台为图谱构建平台提供真实采集数据,标注平台为图谱构建平台提供标注数据,图谱构建平台利用标注数据和真实数据进行图谱构建和可视化。三个平台的相互协作构成了完整的事理图谱平台。