论文部分内容阅读
目前汉语作为第二语言广泛的学习需求使得汉语学习型词典编纂迅速发展,迫切需要通过理论的指导来突出其学习功能,从而摆脱传统语文词典编纂的模式。词典电子化是辞书发展的一个新方向,学习型词典由于其自身的特点,对电子化的需求尤为迫切。XML是词典电子化的重要技术,XML化是词典电子化的一个重要方面。HNC理论模拟大脑语言感知的本质而建立的理论框架适用于指导学习型词典编纂,HNC设计的数学物理表示式和在工程实践中建设的数据库资源,有助于词典电子化的实现。
本文主要采用分析和归纳相结合、内省和实证相结合的方法,在前期《动词词典》编纂实践的基础上,探索了HNC理论、资源和XML技术在汉语学习型词典编纂中的应用。
本文研究的内容主要有以下五个方面:
1.介绍国内外学习型词典编纂和词典编纂电子化的现状,指出国内学习型词典编纂和电子化的不足之处,并简单介绍了本文的实践基础《动词词典》的编纂情况。
2.从理论和技术两个方面,介绍了认知词典学、词汇控制和释义元语言、语料库技术和计算机辅助编纂三个新趋势。经分析得知基于HNC理论的学习型词典编纂研究符合当前的趋势。
3.从HNC概念基元和联想脉络、句类理论、语境单元理论三个方面,从词典的宏观结构和微观结构两个角度,研究HNC理论和资源在词典编排和检索、释义、例证等方面的应用。
4.分析了词典编纂XML化和标准化的重要性,研究了基于HNC理论的词典XML化文档信息,定义了XML化文档的配套文档、XML文档和XSD文档。
5.设计了基于HNC的词典编纂辅助系统,并详细研究了该系统三大核心技术的功能实现。
本文的研究实现了从《动词词典》编纂实践到HNC词典编纂理论的提升,有利于制定基于HNC的面向所有词类的汉语学习词典XML化文档标准,并且还在HNC和XML基础上设计了一个词典编纂辅助系统,提供了一个现代化、半自动化的词典编纂手段。