论文部分内容阅读
WordNet经过近20年的发展,在国际计算语言学界有相当大的影响,是语义词典事实上的国际标准,被普遍认为是用于计算语言学、文本分析和许多相关领域的最重要的资源。目前,WordNet已经被成功地用于词义消歧、语言学自动处理、双语及多国语机器翻译、检索系统等很多方面。然而,这些应用还仅限于计算语言学领域。本文就WordNet在英语教学中的应用进行一些初步探索。
实现WordNet在其它系统上的应用,一个直接有效的办法就是让WordNet与该系统集成。IT-Kid系统的领域无关特性可实现其上的任何系统间的无缝集成,把WordNet迁移到IT-Kid为其广泛应用奠定了基础。WordNet的关系模型比以前的文本模型具有更强的可扩展性,更容易实现模型的优化,更容易和其它系统集成。
WordNet的最初构建并没有考虑量化标记,对WordNet中的部分关系进行了形式化再分类,为以后关系的自动计算奠定了基础。另外,针对语义树的特性,给出了概念与词间的更为准确的语义相似和相关度计算模型。
词汇学习是语义构建的过程,WordNet丰富的词汇语义关系为词汇学习提供了很好的语义构建目标。把WordNet应用于大学英语词汇学习中,首先必须构建一个大学英语语义词典(CESD),滤去WordNet中与大学英语无关的大量词汇和语义关系。我们基于大学英语词汇在WordNet中的特征,构建了大学英语语义词典,从而为WordNet应用于英语教学奠定了基础。
WordNet丰富的词汇语义关系,可以支持语义计算,但其携带的信息还不足以满足英语词汇学习的需要。另一方面一些传统词典提供了词汇的其它大量信息,WordNet与传统英语词典(如牛津词典)的集成为英语词汇学习提供了新的途径。本文对WordNet与其它词典的自动对照进行了深入研究。词典对照的难点在于词义的自动对照,本文中使用向量空间模型对词义注释进行建模,然后根据词相似度计算词义注释相似度,最后使用文本聚类技术实现词义注释的自动对照。