藏文n元语法模型系统

来源 :第十二届全国少数民族语言文字信息处理学术研讨会 | 被引量 : 0次 | 上传用户:qiaofei888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  藏文n元语法模型系统TibetanLM包含了三个模块:词频统计、模型训练和模型评估,实现了三种数据平滑方法。本文实验通过计算模型和测试语料的困惑度对由训练语料训练生成的藏文三元语法模型进行了评估和比较。
其他文献
本文首先介绍了八思巴文TrueType字库的设计理念,然后设计了八思巴文字符输入法和音标输入法,最后建立了八思巴字蒙古语文献语料库,并对其进行统计分析。
本文分析Microsoft Himalaya的OpenType布局表的设计方法,着重探讨布局表的特征标记功能,为设计更多的藏文字库提供一个参考。
本文介绍了信息交换技术在维吾尔文、哈萨克文、柯尔克孜文TrueType字形地方标准、文字形国家标准、点阵字形国家标准,和通用多八位编码字符集锡伯文、满文点阵字形国家标准中的应用。为新疆民族文字标准制定奠定了基础,为实现维、哈、柯、锡伯文(满文)软件产业化、培育外向型软件产业创造了有利条件,也为我国民文信息处理技术的软件研发奠定了应用基础。
本文探讨计算机技术在汉阿语料库建设中,关于语言数据采集、语料来源、加工和索引的有关问题,旨在为语料库建设提供理论依据。
蒙古语同形词的信息词典是个知识库,本文设计开发了一个综合添加、删除、修改、查找、统计、浏览等功能的词典管理平台,并指出维护中需注意的问题。
谜语在蒙古族民族语言文学宝库中占据着重要地位。本文首先探讨了达日罕谜语系统的设计的工作内容、意义和宗旨,旨在完善操作系统,提高儿童学习蒙古语兴趣。
本文立足于传统语言学的基础之上,结合现代语音学研究的方法,分析拉萨话文读辅音韵尾的声学特征,对文读语音单位做出理论上的定性描述和声学的定量分析。
本文介绍了一种少数民族文字处理的硬件产品-藏汉英电子词典在藏语语音处理中的应用,将待播放的藏文文本拆分为字,并按输入顺序排列,根据字与藏语语音文件的对照表,按照排列顺序依次调取各字的藏语语音文件并播放,从而达到将藏文文本实现为藏语语音的效果。
为了缩小语料库的容量,本文以音节作为维吾尔语语音合成系统的基本合成单元,采用聚类分析的方法,研究维吾尔语音节音高的声学特征。
虚词在藏语和英语中的语言形式、结构、功能、来源和使用情况等不完全一致。本文拟从三个方面论述藏英虚词的语法功能、使用特点以及藏英语源和藏英虚词在语法功能上的异同。