论文部分内容阅读
一部具有尽可能多相关联的语法信息、语义信息、语用信息的语义词典(Semantic Dictionary),是自然语言理解、学习的基础和关键。
语义研究,特别是词汇语义研究,成为目前自然语言理解与处理领域的热点和前沿课题。20世纪80年代以来,基于各种语义、语法理论的大规模语义知识系统相继建立起来,目前国内外的研究成果在语义工程方面主要有Princeton大学的WordNet、Berkeley大学的FrameNet、Microsoft的MindNet、董振东的HowNet等。这些资源已经相当丰富并已有很多具体应用。面对当前众多的语义词汇资源体系,在对其进行统一融合基础上,实现在语言学习特别是英语学习中的应用是本论文的基本思想。
首先,作为基础工作,本文对现有的一些语义词汇资源(包括传统机读词典和语义知识工程资源)进行了回顾,对其中主要的进行了分析和总结。在此工作之上,本文以知识集成为目标,结合面向对象思想方法,根据IT-Kid集成软件辅助工具及其概念关系模型的描述能力,以功能分析和语义实体分析为切入点,设计了一种有利于融合其他语义资源体系的语义词典模型,并论述了其模型可扩展性,设计了程序应用的可继承性。
然后,在各种语义词汇资源中,本论文主要以最具代表性的WordNet为研究对象,实现了其向IT-Kid语义词典模型的迁移,为以后实现更多的资源迁移打下了基础。在此基础上,根据软件架构设计层次模式,进行了语义词典实体、数据访问程序组件的设计与实现。
最后,根据词典信息显示与大学英语语义词典(CESD)的构建需要,实现了对词汇概念语义树构建的分析与算法设计,并以WordNet和牛津词典为对象,对词典之间词义对照进行了探索以及一种算法的尝试。以此为基础,提出了大学英语语义词典(CESD)的构建方法,并设计实现了词典信息显示与CESD辅助构造程序界面。