论文部分内容阅读
世界范围内的自然语言处理,经过字处理、词处理之后先后进入句处理阶段。无论是基于规则还是基于统计的处理策略,都面临“句法—语义”接口或界面问题。本文以语义语法学理论为指导,基于“句法—语义”接口的相关研究成果,以现代汉语一价动词为研究对象,从“词汇单位—角色实现—角色排序—句法映射—模型建构”的角度,揭示一价动词“句法—语义”接口机制,构建接口模型,对汉语本体和语言信息处理研究都有重要价值。首先,在对国内外相关研究文献综述的基础上,参照单义性、典型性、常用性三原则筛选确定一价动词的研究对象。在此基础上,从词汇语义和句法语义两个层面进行词汇义征分析和句法语义范畴分析,为一价动词义场的接口研究奠定基础。具体言之,在词汇语义层面,基于《词汇义征标记集》(2689个),分析筛选出的一价动词义场中的15个典型词元的词汇语义,形成一价动词义场的义征分析序列模式和词汇义征集。在句法语义层面,基于《句法范畴义征标记集》(76个),分析一价动词义场在句法组合层面所可能关涉的语义角色和句法范畴义征。其次,基于一价动词标注语料库,从“词汇单位—范畴义征—角色范畴”的角度,探究一价动词的“词汇—句法语义”接口问题,验证并完善凭借句法范畴义征的词汇单位转化为句法语义范畴的衔接机制,即相同的范畴义征决定相同的句法表现,相异的词汇义征制约具体的组合对象;词汇单位—外层角色衔接时,表现为范畴义征的制约性趋强,词汇义征的制约性减弱(孙道功2011 )。再次,基于一价动词标注语料库,归纳一价动词义场词元的语义角色的排序模型,统计分析原型句模和派生扩展句模,从而对该类动词对应句模的衍生机制进行揭示。统计归纳一价动词义场中的词元,三个义场内部对各种排序模型小类进行合并,共形成13大类297种句模形式,具体包括一价动词动作类义场涵盖4大类119种句模形式,状态类义场涵盖5大类82种句模形式,心理类义场涵盖4大类96种句模形式。同时,基于标注语料库,探究一价动词义场语义角色映射情况和句型句模对应关系,考察角色句法实现的优先序列。语义角色总是优先选择原型位置,优先映射为原型句法成分,语义句模总是优先选择原型句型结构。一价动词各个子义场中,施事、当事、感事优先映射为主语,极少频率映射为宾语。同时,外层角色多为单一映射,主要投射为状语或补语,个别角色(如感者)可以映射为宾语。从词汇语义角度看,语义角色到句法成分的原型位置的映射受到词汇语义的制约,词汇单位对应事物的属性也会影响投射的位置的选择。最后,基于一价动词标注语料库,从词汇语义对句法结构的制约以及句法结构语义的反制约探讨了“句法—语义”接口中词汇与句法的互动制约关系。结论认为一价动词的“句法—语义”接口中,词汇语义发挥底层制约作用,表现在两个方面:词汇到语义角色的衔接以及语义角色到句法成分的投射。一价动词的词汇语义决定了施事或当事或感事成分必须都是具有[+有生性]的“生物”义场中的词汇。其中,进入施事位置的词汇要求附属于“动物”义场或“人类”义场,进入感事位置的词汇要求附属于“人类”义场。同时,即词汇义征的共有特征或隐含特征影响了对外层角色的选择以及其出现的频度的高低。一价动词的句法结构对词汇语义在定向度、生命度等方面产生影响,并且对进入句法结构的一价动词的词汇语义产生影响,导致其发生凸显、增加或转化。本文属于基于标注语料库对典型义场的个案研究。由于时间、能力以及语料库规模等方面的限制,研究比较粗浅。这一领域还有相当多的选题,特别是接口中词汇与句法接口的互动关系、句法语义范畴的语用实现等都亟待深化。