论文部分内容阅读
文章探讨了一个中介语语料库的建设设计,它具有精加工的特点,主要体现在完备语料属性、细化偏误标注分类和过滤冗余信息三个方面。在过滤冗余信息时,采用两个函数先后运算的优化算法,降低数据稀疏,提高语料库的质量。整个建设过程采取数据建设与软件建设同步进行的方式。该语料库具备可扩展性,能够进一步收录和处理更大规模的语料。