维吾尔语多音词的统计分析

来源 :第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会 | 被引量 : 0次 | 上传用户:ten_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语语音合成研究方面,多音词的研究甚少是影响进一步提高合成性能的重要原因之一。本文深入研究维吾尔语中的多音词现象,从包括13,607,507个单词的708,322个句子文本中统计出了多音词在维吾尔语中的出现频率和不同读音的使用频率,通过分析统计结果并根据多音词本身的特征对它们进行分类。从而为进一步研究维吾尔语多音词自动注音方法打好了基础。
其他文献
这篇论文介绍了一个新颖的关键词组提取方法。该方法使用了LDA模型。方法通过LDA模型来获得文档的主题信息,通过将这些信息与其它特征信息整合起来,给短语进行了打分,
会议
本文提出了一种用语义标签、语义指纹来表示关联语义知识的形式化方法,其中语义标签指代语义中的一个知识单元(也即概念),语义指纹是对语义标签所指代概念的描述,由语
会议
人物属性抽取是人名搜索引擎和社会关系网络构建的重要基础。本文提出了一种从维基百科中自动获取人物属性的方法。该方法利用人物类维基文本现有信息盒中的“人物
会议
通用口语语料库由于自身结构和数据冗余的原因,难以和口译教学实践相结合,外语教师可以自建小型口译教学语料库以辅助口译教学。本文从语料选取、标注工具制作和语料
会议
目前我国大学英语师资和在校学生数量比例失调情况严重。参考教育部高教司最新颁布的《大学英语课程教学要求》,新一轮大学英语改革的核心任务是要建立一个“基于计
会议
@@当前,关于句法语义的研究正方兴未艾,形成了一个新的热点和亮点。但是,具体的专题性研究比较多,而有关的理论问题却还没有引起大家充分的重视。特别是语法形式与语法
会议
普通话水平测试评分细则是《普通话水平测试大纲》评分系统的操作性文本,是测试现场操作的重要依凭。本评分细则研究在《普通话水平测试大纲》修订和《普通话水平测
会议
@@1985年,陆俭明、马真两位先生提出了一个在汉语对外教学实践中的语法疑难问题,即为什么成语“合情合理”跟“偏听偏信”会在如下的句法环境中形成对立。
会议
本文以提高合成语音自然度为研究背景,以语句韵律层级的手动标注提供理论依据为目标,首先定义了维吾尔语韵律和层级,收集整理了一套适合于现代维吾尔语句子韵律层级
会议
最大熵模型能够充分利用多个任意的特征。本文中提出基于最大熵模型的维吾尔语词性标注方法。本文中主要的工作是选出对兼类词和未登录词词性标注有较大贡献的特征
会议