论文部分内容阅读
本论文对英汉语篇回指中语法角色和语义角色的作用进行了对比研究,目的是:1)考察这两种因素在回指中的相对表现;2)研究如何将二者结合以提高消解准确率;3)探究造成消解失败的原因。 为了研究上述问题,我们设计了两种指代消解算法:语法消解算法和语义消解算法。前一算法基于语法角色等级排序选定先行语,从而考察语法角色在回指消解中的作用。后一算法基于语义角色排序选定先行语,从而考察语义角色在回指消解中的作用。我们运用这两种算法来消解英汉叙述体语篇中的零形代词和代词,并对二者的消解结果进行了比较。此外,我们详细分析了语法消解算法或者语义消解算法单独可以消解的回指用例,以及那些两种算法均未能消解的回指用例,并且探究了造成消解失败的原因。最后,我们探讨了如何将语义角色的作用整合到语法消解算法中以提高准确率。 研究发现,两种算法的消解都非常成功。就英语语篇中的回指而言,语法消解算法的总体准确率是95.3%,语义算法消解的总体准确率是95.2%。就汉语语篇中的回指而言,语法消解算法的总体准确率是92.9%,语义消解算法的总体准确率是92.6%。在英、汉两种语言中,语法消解算法的消解结果稍微优于语义消解算法,但二者没有显著差异。 详细的对比考察显示,就英语语篇中的回指而言,两种算法均能成功消解的回指占95.1%,语法消解算法单独可以消解的占0.2%,语义消解算法单独可以消解的占0.1%,余下的4.6%是两种算法均未能消解的。就汉语语篇中的回指而言,两种算法均能成功消解的占91.8%,语法消解算法单独可以消解的占1.1%,语义消解算法单独可以消解的占0.8%,余下的6.4%是两种算法均未能消解的。 此外,英语语篇中语法或语义消解算法单独可以消解的回指,其候选先行语出现于被动结构、存现结构或者双宾语结构。汉语语篇中语法或语义消解算法单独可以消解的回指,其候选先行语出现于存现结构、句法话题结构、被动结构,或者位于主语和主语属格语位置。 就英语语篇中的消解而言,造成消解失败的原因有:合指、下指、语义选择限制、语篇指向、重复优选倾向、因果关系优选倾向以及常识优选倾向,其中常识优选倾向可以解释将近一半的消解错误。就汉语语篇中的消解而言,造成消解失败的原因有:下指、语义选择限制、语篇指向、重复优选倾向、因果关系优选倾向以及常识优选倾向,其中语义选择限制可以解释将近一半的消解错误。 最后,我们发现,语义角色在指代消解中的作用可以通过生命度优选倾向整合到语法消解算法中,这样不需要借助语义角色就能够提升消解。该倾向可使语法消解算法在英语语篇中的消解准确率提高0.1%,在汉语语篇中的消解准确率提高0.5%。 因为语法消解算法的消解结果比语义消解算法更好,且语法角色标注比语义角色标注更容易也更客观,所以结论是,语法消解算法优于语义消解算法,语法角色比语义角色更适合应用到指代消解中。此外,应将生命度优选倾向纳入到指代消解中以提高准确率。