论文部分内容阅读
自然语言语法分析是放多自然语言处理任务的中心问题。自然语言分析的难点是歧义性,如切分歧义性,语法歧义性,语义歧义性等。传统的基于规则的自然语言语法消歧分析,主要依靠穷举各种可能的歧义性,并显式地说明有助于消歧处理的知识。这种方法在一定程度上获得成功,然而也反映出它不适合于处理多歧义、大词汇量的分析,主要表现在对于分析错误和新的语言现象处理需要不断修改语法规则,没有系统的方法进行处理。基于统计的自然语言分析方法,从语言中抽取各种语言现象的分布规律,提高自然语言处理的正确率。基于判定树的统计分析方法,从语言中抽取各种语言现象的分布规律,提高自然语言处理的正确率。基于判定树的统计分析方法,能够应用于拥有非常复杂和详细语法,不易于手工实现的大部分领域,依靠词法和上下信息来准确地分析句子,具有更高的分析正确率。