论文部分内容阅读
本文基于计算语言学理论与方法,构建了八思巴文文献语料库,通过对八思巴文不同音标的比较研究,对八思巴文文献语料库进行读音音标和字形音标的自动标注。为了进一步分析语料库的各类信息,又对八思巴文语料库进行了词性、语义、命名实体的标注。本次所构建的数据库分别有八思巴文文献音标库、八思巴文文献信息管理库、八思巴文-汉文-蒙古文对应库、资料图片库等四个基础库。这几个库功能方面各有千秋,但相互关联构成一个整体。论文对构建八思巴文文献语料库时所遇到的语言学问题和技术问题以及解决的方法进行深入探讨的同时又着重介绍了有关八思巴文文献语料库管理程序和检索平台的结构与功能。