论文部分内容阅读
目前语块库的构建越来越受到重视,但对语块标注和部分句法分析的研究还比较少,对双语语块的研究则更少。这样,在构建双语语块的过程中,势必会遇到一些问题,这些问题很难用一个简单的规范来解决。本文在亲自标注两万句汉英语块的基础上,列举了习语、歧义、词性标注错误等六个问题,并对其进行了相关论述。这些问题的解决对于语块标注规范的制定,以及语块库的构建工作都会有所帮助。