基于框架语义的隐式篇章关系推理方法研究

被引量 : 0次 | 上传用户:wqiufeng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章关系分析是自然语言处理领域的一个重要研究方向。在篇章分析领域,篇章是指由一系列语义上连贯结构上衔接的论元,经过结构化组织形成的自然语言文体。其中,论元是具有独立语义的论述单元。篇章关系是同一篇章内,毗邻或跨度在一定范围内的两个论元之间(称作“论元对”)的语义逻辑关系(如,“因果”等)。篇章关系分析旨在对同一篇章内两个论元之间的语义连接关系进行自动识别和判定。宾州篇章树库根据两个论元之间是否存在显式的连接词(称作“线索词”,如“因为”、“然而”等),将篇章关系划分为显式篇章关系和隐式篇章关系。显式篇章关系因具有显式连接词可直接指向特定的篇章关系而易于推理,然而隐式篇章关系由于缺乏显式连接词导致推理难度较高。本文针对推理难度较高的隐式篇章关系,提出一种基于框架语义的隐式篇章关系推理方法。该方法根据“论元语义平行,则篇章关系平行”的理论假设(即“显式论元对”和“隐式论元对”在语义层面上相似,则两个“论元对”的语义关系相同),借助信息检索技术,从大规模静态语料中挖掘与待测“隐式论元对”平行的“显式论元对”,构建无监督的隐式篇章关系推理系统。主要研究内容包括以下三个方面:1)基于框架语义对的隐式篇章关系推理由于现有的隐式篇章关系推理方法脱离了论元的语义信息对隐式论元进行关系分析,仅局限于论元特征的关联分析。针对这一问题,本文有效利用框架语义知识库及其相关识别技术,实现论元语义框架的自动识别。在此基础上,借助大规模文本中框架语义对之间关系的分布概率,进行论元语义一级的关系判定,从而提高最终的隐式篇章关系推理性能。2)基于框架语义向量的隐式关系推理仅通过框架语义对之间关系的概率分布推理隐式篇章关系,不能表述论元的整体语义概念。基于此,本文提出一种基于框架语义向量匹配的平行关系推理方法。利用框架语义学,将论元抽象为概念一级的语义描述(简称“框架语义向量”),实现描述形式的压缩。基于大规模静态数据,通过框架语义向量的匹配挖掘可比较“论元对”辅助关系推理。3)基于局部框架语义森林的隐式关系推理优化现有的隐式篇章关系推理方法并未考虑论元所在的上下文环境,然而上下文信息对论元之间篇章关系尤其是隐式篇章关系推理的影响是不容忽视的。因此,本文提出一种基于局部框架语义森林的隐式篇章关系优化方法研究。通过对“论元对”及其所在的上下文构建局部框架语义森林,并融合待测“论元对”和候选“论元对”之间的框架语义向量相似度和上下文环境相似度,形成局部框架语义森林相似度,推理待测“论元对”的隐式篇章关系类型。
其他文献
忍冬是中国传统中药材金银花的药源植物。采用高效液相色谱—光电二极管阵列检测器联用技术(HPLC-PAD)和高效液相色谱—电喷雾离子化—多级质谱联用技术(HPLC-ESI-MSn)对忍冬
党的十八大报告在谈到加快推进社会体制改革时明确要求加快形成政社分开、权责明确、依法自治的现代社会组织体制。建立现代社会组织体制,促进社会组织健康有序发展与非营利
<正>广播在我国的传媒史上曾辉煌一时。但从上世纪90年代开始,随着电视媒体的出现和普及,广播的听众锐减,广播逐步由“一枝独秀”转为弱势”媒体。当时就曾有人预言:广播媒体
【目的】杜仲为雌雄异株多年生木本植物,具有重要的药用价值与经济价值,其利用价值因植株性别而异,尤其是杜仲胶含量及其他次生代谢产物在雌雄植株中都存在差别,但杜仲在开花
以万盛风景区为研究区域,从风景区的旅游承受能力出发,对旅游环境容量、旅游生态容量、旅游空间容量和旅游生活环境容量进行了定量的分析,指出了存在的问题,提出了加快开发万盛区
介绍了制成螺纹插装式的电比例阀的结构和工作原理。
目的:在矿难病人中采用营养支持对预防再喂养综合征发生的临床效果观察。方法:对20名矿难病人进行营养风险筛查以及再喂养综合征风险评估;采用肠外营养、肠内营养支持及膳食
基于有关数据与信息,本文就大家关心、担心的电磁辐射及安全健康问题做了点分析、介绍,旨在让大家科学地认识、理解电磁辐射及相关问题.
我国社会主义市场经济体制的建立以及改革的进一步深化,给当代中国社会带来了全面而深刻的变化。一方面,经济得到快速增长,我国已成为世界第二大经济体;另一方面,相关的矛盾
本文通过对我国企业组织结构一般特征的分析,提出以人为核心,用权变观设置企业组织结构。