基于混合基元的藏语语音合成技术研究

来源 :陕西师范大学 | 被引量 : 5次 | 上传用户：sqm_crscd

【摘要】

：

语音合成是人机交互的核心技术之一,也是中文信息处理中的一个难题。语音合成的目标是将文字信息自动转换为清晰、流畅的语音,它的研究对自动控制、智能机器人和人机语音通讯

【作者】

：

才让卓玛

【出处】

：

陕西师范大学

【发表日期】

：

2016年01期

【关键词】

：

藏文信息处理语音合成基元构件

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音合成是人机交互的核心技术之一,也是中文信息处理中的一个难题。语音合成的目标是将文字信息自动转换为清晰、流畅的语音,它的研究对自动控制、智能机器人和人机语音通讯系统等的研制具有重要的理论意义和实用价值。随着计算机技术和通信技术的发展,基于语料库的语音合成技术越来越引起社会的关注。藏文信息处理作为中文信息处理的重要组成部分,经过二十多年的发展,在分词、标注及词频统计等方面得到了长足进展,但藏语语音合成技术研究才刚刚起步。目前对藏语语音合成有价值的许多属性未能被挖掘和描述,对藏语本体的研究也不够深入。例如,现有系统还不能对藏语的韵律特征进行定性与定量分析,也不能通过文本分析为系统提供必要的控制信息等。本文立足于藏语言文字本体,从语言学和语音学角度研究藏文的文本特征和藏语韵律特征,并基于语料库语音合成技术,设计实现了一个实用的基于混合基元的藏语语音合成系统。文章的主要工作包括以下几个方面:(1)从藏语文本入手,研究了非藏文字符和句子边界识别等语音合成的预处理问题,并根据藏语语音合成的实际需要,提出了基于词性约束的藏文分词算法。相对于传统分词算法,该算法通过词性搭配规则避免了大多数交集型和包孕型歧义的产生,改进紧缩词和未登录词的识别策略,使分词的效率得到了明显改善。另外,为了解决未登录词的语音合成问题,给出了藏文字构件分解算法,并通过开发藏文字构件分析系统验证了算法的性能。同时,将该系统从大规模语料中统计的构件分布信息用于指导基元的选取与语料库的构建。该内容见第二章。(2)从声学及语法特征入手,统计分析安多藏语的韵律层级结构、重音模式及语调现象,研究了藏语的韵律控制规则。首先,提出了藏语的韵律层级结构预测算法,该算法综合运用虚词频度与韵律短语长度信息动态地标记韵律单元边界,避免了韵律层级结构划分过分依赖于分词结果的现象,保证了韵律层级结构的完整性。其次,计算出各级重音的相对系数。合成时先分配韵律词、韵律短语和语调短语的语法重音,然后根据各级韵律单元重音的相对系数计算目标语句的强调重音。最后,给出陈述句、疑问句、祈使句和感叹句的语调特征及语调规则。实验数据证明,本文的韵律规则对语音的韵律表达起到了重要作用,语音的自然度得到较大的改善。该内容见第三章。(3)基元选择是建立结构合理、规模适中的语料库的基础,也是基于语料库语音合成的关键。为了提高系统的韵律表现并兼顾基元的搜索空间,提出混合基元库构建策略,并给出相应的基元选择算法。主、客观实验数据表明,混合基元库策略与算法有效地保留了大基元的完整性与小基元的灵活性及鲁棒性。为了避免语音合成时对基元做过多的算法调整,文章基于混合基元库采用多样本波形拼接策略,即一个(文本)基元在语音库对应多个候选样本。同时研究了多样本语音库的组织策略与搜索算法。实验证明,与传统算法相比,该算法提高了合成速度,增强了系统的实时性。该内容见第四章。(4)以安多藏语语音合成系统为代表介绍了藏语语音合成系统的设计思想、目标、功能特色及性能评测结果。该系统在文本分析、韵律控制方面都比较有特色,为我们继续研究语音合成技术提供了实验平台。该内容见第五章。

其他文献

跨国经营与现代企业的制度要素

20世纪以来,特别是二次大战以来,企业的跨国经营成为现代经济的一个重要现象,跨国公司也成为现代世界经济中最具活力的经济活动的主体。作为与现代世界经济相对应的企业组织

期刊

现代企业制度子公司母公司现代世界经济市场经济东道国政府企业组织形式制度要素

2017年欧洲心胸外科学会/欧洲心胸麻醉学会成人心脏外科血液管理指南的解读

<正>体外循环(cardiopulmonary bypass,CPB)支持下的心脏外科手术需要抗凝,易出血。输血是保证心脏外科手术安全的一项重要措施,但过量输血常导致患者预后不良。目前仍缺乏一

期刊

成年人心脏外科手术输血出血临床管理

维格列汀联用二甲双胍治疗2型糖尿病的疗效和安全性

目的分析维格列汀配合二甲双胍应用于2型糖尿病(T2DM)治疗的可行性。方法以2016年3月至2017年9月期间医院收治的128例T2DM者为本次观察对象,患者在运动、饮食治疗无效情况后

期刊

疗效2型糖尿病维格列汀二甲双胍Efficacy Type 2 diabetes mellitus Vildagliptin Metformin

基于风险管理的企业内部控制研究

基于风险管理的内部控制正在发展为一种潮流.本文首先阐述国内外内部控制理论的产生和发展,分析了我国企业内部控制的现状,进一步提出企业应从制定合理的发展目标、加强企业

期刊

风险管理内部控制现状体系

风电机组叶片防结冰涂料防结冰性能评价方法研究

防结冰涂料是国内外普遍采用的防止或减轻叶片结冰的有效方法之一,该技术目前还不够成熟,对涂料的防结冰性能评判暂无统一标准,缺失对防结冰涂料系统、全面的测试与评价方法

期刊

风电叶片防结冰涂料防结冰性能测试评价

线性阵列基因分型技术检测女性尿液中人类乳头瘤病毒

目的：检测尿液标本中人类乳头瘤病毒（HPV），并与宫颈以及外阴标本进行比较，探讨其与宫颈疾病的相关性，从而为宫颈癌的筛查提供参考。方法收集患者新鲜尿液以及外阴和宫颈分泌物，采用

期刊

人乳头瘤病毒尿液筛查human papillomavirusurinescreening

基于无线网络信号传播特征的三种感知问题研究

无线网络信号的传播特征被广泛应用于信息感知领域,按照信息感知的目标维度不同,信息感知划分为空间维度信息感知和频域维度信息感知两大类。本文从如何利用空间维度信息感知

学位

无线网络信号传播特征位置感知人体动作感知频谱感知

无铆钉铆接强度及失效模式预测

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

无铆钉铆接拉剪试验失效模式计算公式

浙江省各市县就业人员的聚类分析

引言由于我国人口众多,地区间经济发展不平衡,加之产业结构转型下资本对劳动的排斥必不可免,在劳动力整体供大于求的情况下,就业总量矛盾虽有缓解,但就业的结构性矛盾和区域

期刊

茶文化对提升体育文化修养的影响

当前我国综合实力快速发展,经济方面已成为世界第二大经济体,高精尖科技已走在世界的前列,军事技术也不断的完善。除此之外,国家综合实力还应包括文化方面。根据专家分析,当

期刊

茶文化体育文化修养

基于混合基元的藏语语音合成技术研究

与本文相关的学术论文