论文部分内容阅读
从真实的语料库中选取句子是蒙古语句子处理层面上第一个问题,它是分析句法结构的最基础性工作之一。本文主要介绍了采用人机互助方式从词性标注的100万词级的现代蒙古语语料库中选取了所有简单句,并用程序,按句子长度和谓语中心词的词性进行了分类。初次开发的程序在按词数和谓词的词性分类的准确率分别是98.7%和94.1%,实验结果表明程序能比较准确地辨别和分类句子,但在实义词、倒装句等的识别能力仍有待提高。