论文部分内容阅读
藏语的内涵非常丰富,词语的数量呃非常多,其内涵非常丰富,甚至还形成了藏文化,吸引着越来越多的学者去研究和分析它,藏族的词藻学,与算学、戏剧学、诗词学、音韵学等构成了藏族传统文化的主要内容,13世纪之后,藏族文化受到了外来文化的影响,特别是与西藏最接近的印度,他们的文化持续对藏族文化带来着影响,由于印度文化中对词语的使用非常讲究,因此,使得词藻学在藏族文化中获得了更好的发展,所以说藏文藻饰词是藏文化的一种独特现象。从古至今,境内外学者在研究和传承藏族文化的同时竭力运用藏语藻饰词,很多学者也将藻饰词运用到各类学科,进一步丰富和完善了藏语的词汇系统,更进一步加强了藻饰词在藏语文化中的作用性。有学者曾今这样说过辞藻就是用于在描述一段事物的时候,修饰人们的语言,以更好的表达出这件事的真实性或者是虚假性的文化,也有学者指出,每一件事物,除了它本身的表达之外,还有各种各样的形容词可以用来描述它,例如可以用诗歌来进行表达,而这类具有一定审美和修辞的性质的词语,就被成为是藻饰词[51],因此,藏族的藻饰词同样也是这个作用,用于做一些特殊的形容和表达,具有特殊的含义和性质。其实,这些认识只是认识了藻饰词的表面,还没有深入探究的其内涵,没有吧藏族文化的精髓给认识到,例如,藏语的“?????????”在翻译为中文的时候,我们应该把它翻译成“藻饰词”,而不能简单的将其直接翻译为“别称”,有学者曾今指出,藏语之所以大量使用了藻饰词,主要是因为藏族文化在长期发展的过程中,力求表达优美,让人们喜欢这样的表达。其次是因为大量使用藻饰词,能够让藏文避免重复和单调,增加藏文的文学美观性,最后还有一点原因是,藏文中大量使用藻饰词,能够有效的调整藏文的音节,使得藏文的整体更加美观可靠。[52]但截至目前,基于计算机信息处理方面缺乏藻饰词研究。藻饰词分布在藏文学的各种文体和文章,如果不能理解藻饰词,对于文章要达到层面上的理解也是较为困难。关于计算机处理方面的藻饰词研究是藏文信息处理必须要迈入的一步。本文在生语料的选择上依据语料的平衡性,在语料的选择范围中涉及诗歌、佛学、民歌、散文、论文、小说等领域。并从442篇语料中,共提练出1491个藻饰词,在NicroMoft Excel数据库中手工录入其1491个藻饰词,对其进行了英汉翻译,并加注了藻饰词的释义,截止目前词库字数总计10万字。藏文藻饰词传统的分类方法是在词语同属的种类或生存的环境为主要依据而进行分类,并没有从某个特定立场对一个语义类别进行细致地分类,使得原来共同属于一个语义类别的词语,可以在某个或某些语义特征上提取不同的值,从而突出这些词语相互之间的异同。为了弥补这一不足,此文是继扎西草女士的《藏语藻饰词信息库构建》研究的基础上,借鉴北京大学詹韦东所采用的语义分类体系。《藏语藻饰词信息库构建》中对藻饰词的名词、动词、形容词等进行了语义分类,在数词与名词的语义标注中存在部分标注模糊的情况,本文根据藻饰词自身特点和语料库的实际运用性为出发点将藻饰词分为名词和数词两大类(藻饰词无形容词和动词故不做此项分类)并对语义标注进行了调整和补充。本文根据藏文藻饰词的自身特点,结合wordnet本有的语义关系和藏文词汇之间的语义关系,共选取四种适用于藏文藻饰词词汇间的语义,获得了所设置的9个属性字段相应的700个同义词集合,建立了《基于Wordnet的藏文藻饰词的语义库》。能够有效的达到本文所分析的目的,就是基于Wordnet的藏文藻饰词语义关系进行了比较详细的分析。其创新点在于:(1)摒弃了藏文藻饰词传统分类方法的不足,借鉴北京大学詹韦东所采用的语义分类体系结合藏文藻饰词自身特点共分2个大类、57个中层类,层级深度达到8级。(2)根据藏文藻饰词的自身特点,结合wordnet本有的语义关系和藏文词汇之间的语义关系,共选取四种适用于藏文藻饰词词汇间的语义,获得了所设置的9个属性字段相应的700个同义词集合。本文以Wordnet设计原理及方法为理论依据,根据真实语料获得藏文藻饰词并分析,以满足分析结果的科学性和系统性。进一步为面向藏文信息处理的现代藏语语义信息词典做好了基础性理论研究和准备。