论文部分内容阅读
句子经常省略主语,即零指代,是汉语的一个重要的语言特点,这是汉语句法精练的表现.但与此同时,大量的零指代现象造成了汉语的语义严重依赖上下文,为汉语语言的形式化,特别是在汉外机器翻译的研究带来了很多的困难.这也是现阶段汉英机译系统的翻译质量远远低于英汉机译系统的一个重要原因.该文主要探讨汉语零主语指代的消解问题,研究的语言对象主要是由两小句组成的汉语句子,其中后一小句省略的主语可以在前一小句中找到指代对象.我们提出了十条试探性的规则用来解决汉语零主语指代的消解问题.这十条规则是:1)最可能主题规则2)关联词规则3)存现动词和系动词规则4)表语结构规则5)连动句规则6)语义距离规则7)把字句规则8)物主代词/名词规则9)使役动词规则10)感叹句规则.这些规则结合在一起可以解决一些以往的理论所不能解决的零主语指代现象.同时我们还设计了一套算法用来实现这些规则.我们把该算法用于一系列手工标注的语料中,结果证明该算法具有较高的精确度(大于80%)