论文部分内容阅读
回指解析一直是语言研究中最为基本和重要的问题之一,同时也是哲学、人工智能、认知科学等很多相关领域内的热门话题。本文受中心优选理论(Beaver,2004)的启发,以语篇结构的多层次分析为基础,提出了一个侧重于篇章回指处理的优选理论模型,并利用小型英文语料库验证了它在回指解析中的出色表现。中心优选理论将优选论(Prince&Smolensky,1993)和中心理论(Grosz et al.,1983,1995)有机地结合在一起,在很大程度上简化并优化了以往的同指解析方案,一经提出就受到了语言学界的广泛关注。遗憾的是这一理论没能摆脱中心理论的羁绊,仅从语篇的线性发展入手将语篇的局部连贯作为回指解析的主要依据,因而在回指解析的过程中遭遇瓶颈。例如,它只凭借句法成分来衡量不同语篇实体的突显程度,这一略显粗糙的做法在一定程度上降低了回指解析的准确性。又如,它总是到回指语所在语句的前一句去寻找它的先行语,但先行语的实际位置显然要自由得多。针对中心优选理论的不足和缺陷,本文尝试以语篇的整体结构为基础,利用源自不同结构层面的同指制约因素构建一个更为理想的优选解析模型。
以Grosz和Sidner(1986)的结构理论为基本框架,笔者在第三章对语篇结构进行了较为系统和深入的阐释。Grosz和Sidner将语篇结构划分语言结构、意图结构和注意力状态三个有机联系的部分,为语篇信息处理构筑了一个较为完整的理论体系。但是如果要将它应用于回指研究,有必要对其进一步充实和完善。在界定和明晰了基本语篇单位(ElementaryDiscourse Unit,简写为EDU)之后,笔者分别利用修辞结构理论(Mann&Thompson,1986,1987,1988)和中心理论中的核心内容对意图结构和注意力状态进行了更具体的阐释。修辞结构理论从功能的角度解读语篇的整体性和连贯性,利用多种修辞关系将传递完整命题意义的语篇片段有机地组织在一起。它与意图结构理论最重要的契合点在于它们都认为语篇结构能够反映出说话人交际意图或目标的层级性,同时某些语篇片段因传递相对重要的交际意图而具有核心性和主导性。修辞结构理论在结构分析方面的主要优势在于它提供了一个开放性的修辞关系集,从而为细致描述语篇的宏观结构创造了便利条件。根据回指研究的需要,本文建立了一个包含8种广义修辞关系的集合并从多个角度对它们进行了详细分类,为进一步探究语篇宏观结构与回指现象之间的关系奠定了理论基础。
中心理论所关注的是注意力状态、指称方式的选择在实现语篇的局部连贯中所发挥的效应。这一理论在对注意力状态进行描述的同时揭示了语篇实体的突显性和篇章主题的连贯性在代词使用中的主导作用,从而为同指解析提供了一定的理论依据。但是它涉及多种中心变量(前瞻中心、回望中心、优先中心)和注意力切换方式(持续、保持、转换),使得分析过程略显繁复。更重要的是,这一理论以解读语篇的局部连贯作为最根本的出发点,因而应用于语篇回指解析时暴露出一定的局限性。为此,笔者在第四章将中心理论融入层级性的修辞结构分析之中,从四个方面对其加以补充和完善,力求在局部和宏观这两个密切相关的结构层面上提升这一理论在回指解析中的表现。首先,本文利用基本语篇单位(EDU)和最小修辞单位(Atomic Rhetorical Unit,简写为ARU)对注意力中心的更新单位进行了明确的界定。其次,笔者探讨了如何利用信息状态、指称形式和视角效果这三个核心因素对不同语篇实体的突显性进行评估,以保证有效识别当前的注意力中心。再次,本文详细阐述了三种不同类型的主题修辞关系在注意力中心的切换过程中所发挥的作用,并将它们概括为三大效应:校直效应、并联效应和花园路径效应。最后,为了适度地扩大解析过程中先行语的搜寻范围,笔者利用Fox(1987)在修辞结构的框架下定义的两种回指分布基本模式,即积极模式和控制模式,来解读聚焦空间的推进和跃迁。
优选论最早创立于音系学领域,它所提供的选择机制在回指解析领域有着广阔的应用空间。受中心优选理论的启发,笔者在第五章将不同结构层面的回指制约因素转化为生成器(GEN)和评估器(EVAL)的具体工作机制,建构了一个更为完善的回指优选解析模型。在这一优选框架中,生成器有两大任务:一是识别具有名词性先行语的代词,二是确定先行语的搜寻范围并采集所有潜在先行语。评估器的主要工作是凭借如下六个有序排列的制约条件从候选集合中挑选出最适合的先行语:AGREE>>DISJOINT>>RECENCY>>PARALLELISM>>SALINECY>>ALIGN。简单地说,AGREE要求回指语与其先行词在性、数上达成一致。DISJOINT规定同一谓语的论元彼此不同指。RECENCY限定了不同的回指距离在回指解析中的制约作用,PARALLELISM强调了并联效应对同指解析的影响,SALIENCY反映了各种对语篇实体的突显性产生影响的因素在回指解析中的作用,而ALJGN从语篇宏观连贯的角度体现了校直效应所产生的解析倾向。
本文建立了一个包含三种语篇类型、共计17,311词的英文语料库,对这一优选模型的工作效度进行了检验。在人工标注的基础上,它在处理远距离回指、模糊回指和反向回指(预指)这三种相对特殊和复杂的回指现象时表现十分出色。总体而言,它对语料库中第三人称代词的解析成功率达到了95.24%,这是一个相当不错的成绩。对于解析过程中没能顺利找到相应先行语的29个代词,本文也对它们进行了较为详细的描述和分析,希望有助于这一优选解析模型的进一步发展和完善。