论文部分内容阅读
各类维吾尔文本信息处理技术需要准确、快速、高效的音节自动切分的支持。目前通过辅助音节库的方法解决基于非规范音节结构的外来词语的音节切分。本文在分析维吾尔文音节结构和切分规则基础上,用后序遍历、音节结构的检查,修复不规则音节的方法实现了不依赖附加音节库的全自动音节切分,提出人工生成有限数量的模拟词语的音节切分测试方法,分别用词典和基于模拟词语测试,切分准确率分别达到了100%和96%。