论文部分内容阅读
随着互联网时代的到来,人类进入了信息爆炸的时代,新的词汇大量产生。新词汇的大量产生也给正处于蓬勃发展之中的中文信息处理工作带来了难题。中文信息处理属于自然语言理解,其理想目标是让机器理解自然语言,从而可以实现人工合成语言、人机对话、自动机器翻译等等。但是几十年的中文信息处理的实践表明,以词语切分和标注为起点的信息处理技术面临的一个主要难题就是未登陆词的处理问题,其中最具有挑战性的也就是新生词语的识别与处理问题。