论文部分内容阅读
对词语的搭配研究由来已久。英国伦敦学派的领袖人物Firth在上世纪50年代率先提出(collocation)搭配这一概念之后,随后不同的学者、专家站在各自的视角,给予搭配各种的定义。本文在第一章中从国内外研究词语搭配的现状入手,进一步说明了本论文作为基础性的探索研究,从藏文信息处理这一模块简单的阐明了本课题的研究意义和目的。在第二章中将语言现象作功能分类视为研究藏文普通名词词语搭配研究的首要任务,首先介绍了藏文词类的划分情况和划分的类别,其次,为了提高计算机处理处理藏文词汇时的准确识别率,更为细致化的引出了在藏文名词的基本词汇当中占重要地位的藏文普通名词这一概念。在第三章中采用了以频率为基准的定量搭配法,其中藏文普通名词作为搭配的节点,取节点的前两后两项作为搭配项,用定量共现频率的统计方法获取节点与搭配项之间的互信息;在这一章中还沿用了以短语观为基准的定性搭配法,采用基于规则的藏语句法分析,在藏文当中普通名词与格助词、动词、形容词、代词、方位词、时间词、后缀词等在结构上相互搭配组合成名词短语时的4大结构类型,进一步阐述名词短语在句法中和名词有着相同的功能为本章研究的主要内容。第四章中介绍了在语言内部藏文普通名词在与其它不同词性的词语搭配所表现出来的的语义关系,根据藏文本身的特点详细阐述了在语言中表示词和词的形态变化的格助词((?))与藏文通名词词语搭配时在句子中所扮演的的语义角色;还引用了在一个语义完整的句子中常常起着粘合作用的虚词((?))与藏文普通词语词语搭配时的语义结构关系;在第本章节中还特别介绍了在语言内部藏文普通名词在与其它不同词性的词语构成搭配时同现的歧义问题,重点讲了因藏文普通名词词汇的兼类引起的歧义问题。在最后一章中讲到了本文选取的研究对象为世界史诗当中篇句最长的《岭.格萨尔王》当中的《霍岭大战》篇章,其中共计20868次词条,在此基础上,利用计算机统计的方法统计出来2000个藏文名词,在计算机获取的2000个名词中选取200多个在本文语料当中出现以较高的频率(重复出现5次以上为高频词)的藏文普通名词进行基础性的搭配研究,并建立起搭配库。