论文部分内容阅读
事件作为人类知识的基本单元,较之静态概念可以表达出更高层的语义信息,近年来受到越来越多研究者的关注。文本是信息的载体,对文本资料的理解与应用,是知识得以传播的重要手段。大量的文本,如小说、戏剧、人物传记、新闻报道等都包含有大量事件。按照语言学家的观点,从语义理解的角度,文本不仅仅是属性、概念的集合,在更高的粒度上是对一个个事件的描述,可以把文本语义看作一组相关的事件及其之间关系的集合。面向事件的文本表示,符合人们的阅读和记忆规律,可以体现更高层次的语义信息,为基于语义的知识处理提供了新的方法与技术。近年来,在文本应用领域趋向于更丰富的表示方法,而不仅仅基于关键词和概念。本文围绕事件,针对当前文本表示方法的不足,提出一种面向事件的文本表示方法——事件网络,它是一种文本表示的新模型,保留了文本的语义信息、体现了事件与事件之间的关系,反映出事件的重要度和事件发生的动态行为等重要信息。研究该模型的性质,并建立起高度抽象层次的运算,为基于语义的文本信息处理提供支持。事件网络上的运算将支持大量的关于文本的处理应用,是语义计算的很好的形式。本文的研究内容和创新点主要包括:(1)事件相似度计算。基于给定的事件模型,定义事件间的相似度。事件要素的相似度作为衡量事件相似度的指标,把对事件的相似度计算转化为事件要素的相似度计算,根据事件各要素的特征,结合语法、语义、词语序列、时间关系计算事件的相似度。(2)事件网络模型及其性质研究。定义事件网络的结构和表示,阐述事件网络系统。以事件作为文本的特征项,事件间的关系看作事件间的边,构建文本的事件网络。实验表明,文本的事件网络具有小世界性质,基于这一发现,对网络中的事件节点按照它们对网络拓扑结构小世界特性的重要度排序,提取文本的重要事件,这些被提取的事件是对原文很好的概括。(3)事件网络匹配。无论采用何种文本表示方法,都必须有一个好的文本对比方法。当前有关图的匹配主要来源于图论和信息检索,但是普通图和概念图在结构和语义上都与事件网络存在很大区别,现有的匹配方法均不能很好的适用于事件网络匹配,因此,有必要研究新的事件网络匹配方法。本文提出一种新的事件网络匹配方法:基于相似度极大值优先的事件匹配、基于关系距离同位矩阵的关系匹配、最后整合事件和关系上的匹配完成事件网络的匹配。