论文部分内容阅读
随着我国与柬埔寨的交流合作日益频繁,柬埔寨语的自然语言处理工作变得更为重要,针对柬埔寨语语料库资源有限、柬埔寨语组织机构名标注语料稀缺的问题,提出了一种基于半监督Tri-training的柬埔寨语组织机构名识别方法。该方法利用改进的Tri-training算法,结合柬埔寨语的语言特点进行实验。实验结果显示,准确率和召回率分别达到了65.68%、67.83%,表明该方法能有效利用大量未标注语料得到准确率较高的标注语料。