面向事件的文本表示研究

来源 :上海大学 | 被引量 : 12次 | 上传用户:Kdx1999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件作为人类知识的基本单元,较之静态概念可以表达出更高层的语义信息,近年来受到越来越多研究者的关注。文本是信息的载体,对文本资料的理解与应用,是知识得以传播的重要手段。大量的文本,如小说、戏剧、人物传记、新闻报道等都包含有大量事件。按照语言学家的观点,从语义理解的角度,文本不仅仅是属性、概念的集合,在更高的粒度上是对一个个事件的描述,可以把文本语义看作一组相关的事件及其之间关系的集合。面向事件的文本表示,符合人们的阅读和记忆规律,可以体现更高层次的语义信息,为基于语义的知识处理提供了新的方法与技术。近年来,在文本应用领域趋向于更丰富的表示方法,而不仅仅基于关键词和概念。本文围绕事件,针对当前文本表示方法的不足,提出一种面向事件的文本表示方法——事件网络,它是一种文本表示的新模型,保留了文本的语义信息、体现了事件与事件之间的关系,反映出事件的重要度和事件发生的动态行为等重要信息。研究该模型的性质,并建立起高度抽象层次的运算,为基于语义的文本信息处理提供支持。事件网络上的运算将支持大量的关于文本的处理应用,是语义计算的很好的形式。本文的研究内容和创新点主要包括:(1)事件相似度计算。基于给定的事件模型,定义事件间的相似度。事件要素的相似度作为衡量事件相似度的指标,把对事件的相似度计算转化为事件要素的相似度计算,根据事件各要素的特征,结合语法、语义、词语序列、时间关系计算事件的相似度。(2)事件网络模型及其性质研究。定义事件网络的结构和表示,阐述事件网络系统。以事件作为文本的特征项,事件间的关系看作事件间的边,构建文本的事件网络。实验表明,文本的事件网络具有小世界性质,基于这一发现,对网络中的事件节点按照它们对网络拓扑结构小世界特性的重要度排序,提取文本的重要事件,这些被提取的事件是对原文很好的概括。(3)事件网络匹配。无论采用何种文本表示方法,都必须有一个好的文本对比方法。当前有关图的匹配主要来源于图论和信息检索,但是普通图和概念图在结构和语义上都与事件网络存在很大区别,现有的匹配方法均不能很好的适用于事件网络匹配,因此,有必要研究新的事件网络匹配方法。本文提出一种新的事件网络匹配方法:基于相似度极大值优先的事件匹配、基于关系距离同位矩阵的关系匹配、最后整合事件和关系上的匹配完成事件网络的匹配。
其他文献
目的了解上消化道转移癌的内镜表现和病理特征,提高内镜和病理医师对其的认识和诊断水平。方法对本院收治的3例以消化道表现为首诊症状的上消化道转移癌患者以及复习相关文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨医学重点学科建设对急诊医学科综合能力的具体指导作用。方法根据2016年河北省医学重点(发展)学科建设评估指标体系的具体要求对急诊科5年来学科资源、梯队建设、工
长久以来,科学计算、企业数据处理、多媒体等领域推动并行计算向更高性能、更低成本、更多样地适应需求的方向发展。随着信息检索相关应用中数据量的增加,以及查询难度和需要
通过岩心观察、薄片鉴定、扫描电镜分析等手段,将松辽盆地钱家店地区姚家组铀储层划分为姜黄色-紫红色氧化砂岩、含矿灰色砂岩、原生灰色砂岩3种类型,并讨论了含矿岩系主要的
<正> 如果把有关人体的知识都写成书,足以装满一个图书馆。世界上最大的医学图书馆——美国国立医学图书馆,就存放有300万条人体医学信息。其实,人体IQ(智商)的奥秘几乎是无
元素
从四川成都驱车,沿岷江前行经古城威州,穿杂谷脑河逆流而上,便可到达"东方古堡".远远望去,那一座座高高耸立的石碉楼像一把利剑直刺苍穹,弥漫着苍凉古风.这就是被世界称为建
随着互联网和信息技术的迅速发展,存储在个人计算机中的数据正以前所未有的速度增长。据统计,从2000年至2004年的5年内,个人计算机中的文件数量增长了2倍,文件平均大小增长了75%,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield