论文部分内容阅读
中国组织名字识别在自然语言处理难、重要。为了减少,标注了语料库和使用 untagged 语料库,我们介绍了与支持向量机器(SVM ) 和有条件的随机的地(CRF ) 梳 Co-trainins 改进识别结果。基于 uncorrelated 和兼容机的原则,我们在 SVM 或独自一个的 CRF 和这二个模型的联合以内从不同看法构造了不同分类器。并且我们修改了启发式的 untagged 减少时间的样品选择算法复杂性。在一样的标注数据下面,共同训练的试验性的结果表演比独自使用 SVM 或 CRF 高有 10%F