论文部分内容阅读
近年来许多研究单位推出中文标准语料库,如新加坡国立大学的PH语料库,中央研究院的平衡语料库1.0版及2.0版,除可以提供自然语言处理研究所需的训练及测试资料,帮助建立语料训式的中文语言模型,更可以提供客观、公正的系统评测依据。该文提出以杂讯通道/讯息重建模型配合标准语料库来自动评测语言处理系统,实际应用地网际网路中文处理的两个简单而重要的问题:繁简字码转换与第八位元重建;并利用研究院平衡语料库1.0版及2.0版,进行大规模实验,显示所设计的杂讯通道/讯息重建自动评测模型确为实用可行。