论文部分内容阅读
本文研究了哈萨克语自动词法分析中的构形附加成分的切分和词干提取问题。系统首先对待切分词使用有限状态自动机进行分析。如果成功则将输出作为切分结果,否则再使用双向全切分和词法分析相结合的改进方法来进行切分。与双向切分和全切分算法相比较,该方法提高了词干提取的正确率和切分速度。同时,本文在词干表的搜索中首次采用了改进的29逐字母二分词典查询机制来提高了词干提取的效率。