论文部分内容阅读
在藏文信息处理中,计算机要想真正深刻记忆藏语语法功能,并进行藏文词法分析都需要高精度的语料资源做配合。高质量的语料资源可以为藏文词法、句法和语义分析提供方便,同时还可兼顾语言研究、语言教学及语言规划等其他语言应用领域的需求,并具有扩展性和通用性。因此,藏语形容词的语法功能研究也对藏文词法分析有着极其重要的作用。本论文根据藏语文的特征,以藏语语法理论为基础,将30M的藏语语料进行分词校对后,提取了1035个藏语形容词作为本论文的研究对象,建立了面向藏文信息处理的藏语形容词搭配信息库。首先对形容词进行了界定,根据藏语的音节、语义、语法功能将其进行详细划分,概括其所有的性质及特征,使之与藏文信息技术研究相适应。其次,根据藏语语法特征,将提取的形容词进行内部结构分析并总结其类型特征,获得了藏语形容词的组合形式和组合规律等数据信息,为以后计算机识别藏语形容词提供了可靠的信息基础。再次,通过语料统计藏语形容词的前后搭配,结合藏语传统语法学理论和现代计算机科学的分析方法,分析其所在位置的功能,从而对藏语形容词的构词和造句建立了基础模型。藏语形容词的前后出现较多的搭配词性就是名词、动词、副词,这些词之间搭配采取举例解释说明的方式,为建立藏语形容词搭配信息库提供可靠数据。最后,构建藏语形容词搭配信息库。根据其分类、结构、搭配词性以及搭配频率等将搭配信息库设立了15个属性字段,归纳出藏语形容词的搭配形式和规则,如实填写字段数值。本研究主要通过语料获得词语并分析,力求分析结果的科学性及系统性。通过对形容词的语法功能、语义的划分,有助于阐释词语组合的理据,可为进一步研究藏语语法、语义、搭配及藏语语法信息词典建立提供基础资料支持。