基于语篇结构分析的回指优选解析

来源 :北京大学 | 被引量 : 0次 | 上传用户:zhangchi900207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回指解析一直是语言研究中最为基本和重要的问题之一,同时也是哲学、人工智能、认知科学等很多相关领域内的热门话题。本文受中心优选理论(Beaver,2004)的启发,以语篇结构的多层次分析为基础,提出了一个侧重于篇章回指处理的优选理论模型,并利用小型英文语料库验证了它在回指解析中的出色表现。中心优选理论将优选论(Prince&Smolensky,1993)和中心理论(Grosz et al.,1983,1995)有机地结合在一起,在很大程度上简化并优化了以往的同指解析方案,一经提出就受到了语言学界的广泛关注。遗憾的是这一理论没能摆脱中心理论的羁绊,仅从语篇的线性发展入手将语篇的局部连贯作为回指解析的主要依据,因而在回指解析的过程中遭遇瓶颈。例如,它只凭借句法成分来衡量不同语篇实体的突显程度,这一略显粗糙的做法在一定程度上降低了回指解析的准确性。又如,它总是到回指语所在语句的前一句去寻找它的先行语,但先行语的实际位置显然要自由得多。针对中心优选理论的不足和缺陷,本文尝试以语篇的整体结构为基础,利用源自不同结构层面的同指制约因素构建一个更为理想的优选解析模型。   以Grosz和Sidner(1986)的结构理论为基本框架,笔者在第三章对语篇结构进行了较为系统和深入的阐释。Grosz和Sidner将语篇结构划分语言结构、意图结构和注意力状态三个有机联系的部分,为语篇信息处理构筑了一个较为完整的理论体系。但是如果要将它应用于回指研究,有必要对其进一步充实和完善。在界定和明晰了基本语篇单位(ElementaryDiscourse Unit,简写为EDU)之后,笔者分别利用修辞结构理论(Mann&Thompson,1986,1987,1988)和中心理论中的核心内容对意图结构和注意力状态进行了更具体的阐释。修辞结构理论从功能的角度解读语篇的整体性和连贯性,利用多种修辞关系将传递完整命题意义的语篇片段有机地组织在一起。它与意图结构理论最重要的契合点在于它们都认为语篇结构能够反映出说话人交际意图或目标的层级性,同时某些语篇片段因传递相对重要的交际意图而具有核心性和主导性。修辞结构理论在结构分析方面的主要优势在于它提供了一个开放性的修辞关系集,从而为细致描述语篇的宏观结构创造了便利条件。根据回指研究的需要,本文建立了一个包含8种广义修辞关系的集合并从多个角度对它们进行了详细分类,为进一步探究语篇宏观结构与回指现象之间的关系奠定了理论基础。   中心理论所关注的是注意力状态、指称方式的选择在实现语篇的局部连贯中所发挥的效应。这一理论在对注意力状态进行描述的同时揭示了语篇实体的突显性和篇章主题的连贯性在代词使用中的主导作用,从而为同指解析提供了一定的理论依据。但是它涉及多种中心变量(前瞻中心、回望中心、优先中心)和注意力切换方式(持续、保持、转换),使得分析过程略显繁复。更重要的是,这一理论以解读语篇的局部连贯作为最根本的出发点,因而应用于语篇回指解析时暴露出一定的局限性。为此,笔者在第四章将中心理论融入层级性的修辞结构分析之中,从四个方面对其加以补充和完善,力求在局部和宏观这两个密切相关的结构层面上提升这一理论在回指解析中的表现。首先,本文利用基本语篇单位(EDU)和最小修辞单位(Atomic Rhetorical Unit,简写为ARU)对注意力中心的更新单位进行了明确的界定。其次,笔者探讨了如何利用信息状态、指称形式和视角效果这三个核心因素对不同语篇实体的突显性进行评估,以保证有效识别当前的注意力中心。再次,本文详细阐述了三种不同类型的主题修辞关系在注意力中心的切换过程中所发挥的作用,并将它们概括为三大效应:校直效应、并联效应和花园路径效应。最后,为了适度地扩大解析过程中先行语的搜寻范围,笔者利用Fox(1987)在修辞结构的框架下定义的两种回指分布基本模式,即积极模式和控制模式,来解读聚焦空间的推进和跃迁。   优选论最早创立于音系学领域,它所提供的选择机制在回指解析领域有着广阔的应用空间。受中心优选理论的启发,笔者在第五章将不同结构层面的回指制约因素转化为生成器(GEN)和评估器(EVAL)的具体工作机制,建构了一个更为完善的回指优选解析模型。在这一优选框架中,生成器有两大任务:一是识别具有名词性先行语的代词,二是确定先行语的搜寻范围并采集所有潜在先行语。评估器的主要工作是凭借如下六个有序排列的制约条件从候选集合中挑选出最适合的先行语:AGREE>>DISJOINT>>RECENCY>>PARALLELISM>>SALINECY>>ALIGN。简单地说,AGREE要求回指语与其先行词在性、数上达成一致。DISJOINT规定同一谓语的论元彼此不同指。RECENCY限定了不同的回指距离在回指解析中的制约作用,PARALLELISM强调了并联效应对同指解析的影响,SALIENCY反映了各种对语篇实体的突显性产生影响的因素在回指解析中的作用,而ALJGN从语篇宏观连贯的角度体现了校直效应所产生的解析倾向。   本文建立了一个包含三种语篇类型、共计17,311词的英文语料库,对这一优选模型的工作效度进行了检验。在人工标注的基础上,它在处理远距离回指、模糊回指和反向回指(预指)这三种相对特殊和复杂的回指现象时表现十分出色。总体而言,它对语料库中第三人称代词的解析成功率达到了95.24%,这是一个相当不错的成绩。对于解析过程中没能顺利找到相应先行语的29个代词,本文也对它们进行了较为详细的描述和分析,希望有助于这一优选解析模型的进一步发展和完善。
其他文献
武侠小说是中国文学史上不可或缺的一朵奇葩,是中国文化中独特而璀璨的一页篇章。不同于世界上其他国家的各种文学形式,武侠小说构建了一个极为庞大并且充满侠义的世界——江湖
作为博西家用电器(中国)有限公司总裁兼首席执行官,罗纳德·盖尔克(RolandGerke)的工作日程安排的非常紧凑:先是在北京召开了西门子“真空零度保鲜”冰箱的新品发布会,并且接
2005年4月6~7日,中法建筑论坛在北京举行,来自北京、上海、天津、重庆、广州、深圳、山西、河北、山东、河南等地的国内中青年建筑师与来自法国十多家事务所的200余位建筑师,
2009年9月17日,阿里斯顿热能集团宣布旗下高端商用热能品牌ELCO和民用热水品牌阿里斯顿(Ariston),共同中标上海世博会的三个项目,这也是2008年奥运会后ELCO中标太阳能项目后
2015年12月28日,全国住房城乡建设工作会议在京召开.住房和城乡建设部部长陈政高全面总结了2015年住房城乡建设工作,对2016年工作任务作出部署.副部长易军作总结讲话;副部长
期刊
为有效预测与防治瓦斯煤层冲击地压,揭示瓦斯煤层冲击地压发生机理,建立了发生判据,并对瓦斯煤层冲击地压与煤和瓦斯突出的区别进行了阐述。瓦斯煤层冲击地压是在地应力和瓦
2005年4月27日,北京城市规划学会、北京城市雕塑办公室、杂志社共同召开“中国人民抗日战争纪念雕塑园建园五周年规划设计主题研讨会”.来自建筑设计、规划、雕塑、施工等各
距离2009年顺德家电展开幕,只剩一个月的时间了,经过为期一年的筹备,09顺德家电展已是整装待发,只待盛大开场。记者从组委会了解到,招商招展已经顺利结束,宣传推广、观众服务
期刊
随着节水灌溉技术的发展,新疆节水灌溉面积已达到178.53万hm2,其中膜下滴灌棉田面积达到59.133万hm2。滴灌棉田盐碱化是节水灌溉中产生的新问题,春灌是水利措施改良盐碱地的