论文部分内容阅读
藏文信息处理的现状是未构建出供计算机使用的词汇语义网络系统,而词汇语义网络系统的构建是基于藏文词汇知识库,就国内所创建的CCD、How Net、CWN等词汇语义网,都是基于Word Net(即基于英文词汇知识库)的构建方法获得了成功,Word Net也已成为词汇知识库构建的国际标准。本文是基于Word Net词汇知识库的设计原理及方法,对藏文常用名词概念的理定,藏文常用名词的范围、分类以及藏文常用名词的语义分析等信息,进行分析研究。运用了词汇语义学、认知语义学、藏语语法、计算机技术等学科相契合,采用了以语义场理论为基础的语义分类法与基于对复杂特征集的属性描述法相结合的分析方法,获得并建立了《藏文常用词汇概念Word Net数据库》,探索藏文常用名词词汇的13种语义关系,达到了藏文名词语义分类目的,为面向藏文信息处理的现代藏语语义信息词典做好基础性理论研究。其创新点在于以Word Net概念为依据,对藏文常用名词进行语义分类体系的划分,并对藏文的常用名词进行概念语义框架的表示,进一步地对藏文的常用名词概念进行语义关系及语义成分的分析等。本文中第一章为引言,主要探讨了供机器阅读的(即信息处理应用的)语义类词典在日本、美国等先进国家也已有研究或成果,尤其是概述了Word Net(基于英文词汇知识库)的国内外研究现状,并概述了面向藏文信息处理的词性语义分析的发展现状。分别于第二章中讨论了语言学中的名词概念、词与词义特性、何谓名词概念进行了简要概述。第三章、第四章、第五章为本文的中心部分。第三章中讨论了藏文名词概念的范围、藏文常用名词的分类、藏文常用名词的语义分类体系等问题。第四章中是基于Word Net的藏文常用名词概念的设计原理及方法。第五章中探讨并归纳了对基于Word Net的藏文常用名词概念的13中语义关系的分析与研究。第六章主要描述了藏文常用名词概念Word Net数据库的创建,对藏文常用名词的选取、分类标记、分类标记集的拟定以及藏文常用名词概念Word Net数据库部分示例。