论文部分内容阅读
汉语的句法分析在自然语言处理中起着极其重要的作用。对于基本名词短语的识别可以大大降低句法分析的难度。 从含有词性标注和BaseNP边界标注的语料中抽取所有的BaseNP短语对应的单词和词性序列,通过训练和语言学知识,对其中正确率低并且明显不符合语法的规则进行剔除。在识别的时候,引入了归纳机器学习的方法,以上下文环境约束应用BaseNP的规则。自动识别中,采取规则的最大长度匹配的方式。并且对一些特殊的模板进行了特殊的处理。实验结果表明,这种方法具有可行性,有较高的正确率和召回率。