论文部分内容阅读
长久以来,释义都被视为词典的核心内容。然而,传统词典大都按照音序来排列词目词,这样词与词之间的语义网络变得支离破碎,相互关联的词被人为地分离开来,释义模式也极不统一。这种情况下,词典使用者对相关联词汇的释义理解受到了不利影响,极大地降低了他们的认知效率。范畴化是人类认识世界的基本心理过程,人们先将客观世界中的事物和想法范畴化,再在此基础上形成概念,而语言在其中起到了重要作用。因此,我们决定采用范畴化的方法来改进我们的释义。在本研究中,我们选取了3000核心词作为研究对象,并对如何建立一个基于词汇关系的数据库进行了研究,以期将3000核心词范畴化。具体来说,我们讨论了包括近义、反义、部分—整体、上下义、动词下位关系、常见搭配、语义框架等在内的多重词汇关系,并介绍了因特网上与之相关的各类数据资源,如WordNet,FrameNet,Dante,Sketch Engine等。基于这个词汇关系数据库,我们选取了其中的近义关系进行研究,分别分析了名词、动词、形容词近义范畴成员在现有词典中的释义。在这些释义以及之前提到的词汇数据资源的帮助下,我们找出了每个范畴的原型及各范畴成员的区别性特征。最后,我们尝试提出一个新的释义模式,以相对统一的格式来描述近义词的原型特征,同时也清楚地展现出每个词的区别性非原型特征。通过释义模式的改进,我们希望能在提高词典用户认知效率的同时节约词典中本来用于“近义词辨析”模块的珍贵版面。同时,基于范畴化的词汇关系数据库在电子词典方面有一定的实用价值和发展前景。当然,本研究也存在许多不足之处,希望之后的进一步研究能加以改进。