论文部分内容阅读
尝试将依存树转化为短语结构树,并基于规则的方法自动检测出人工标注结果中的错误。将该方法应用于已经过两遍人工校对的北京大学多视图依存树库,从50275个句法树中发现1529处错误,正确率为100%。进一步,所有错误可以分为3个层次:分词错误、词性与句法角色不符、句法角色错标。该方法可以有效提高依存树库的质量,并且适用于各类型的依存树库。