语音韵律短语边界处的声学表现及语音停顿识别

来源 :山西大学 | 被引量 : 2次 | 上传用户:ran871229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语句韵律结构信息在语音合成与语音识别中非常重要。在语音合成中,自然度与可懂度是两个重要的指标,当前可懂度已经达标,但是自然度还是不够,这是因为计算机无法准确的对语句信息中的韵律进行识别。在语音识别中,要实现人机自然交流,让计算机能够读懂人的语言,并精确辨别语句含义或说话人,从而将说话人语句转换为机器语言,并按照语句含义进行准确操作,这就需要计算机能够准确识别语句中的语音停顿并对语句进行自动划分。所以,语句的韵律信息非常具有研究意义,而韵律是一个感知概念,语音中包含的韵律信息比文本更加准确。所以本文从声学角度出发,直接从语音中提取声学特征参数,对韵律短语边界处的声学特征参数进行分析,并基于所得的声学特征构建模型,实现基于语音的语音韵律停顿识别。本文主要工作有以下三部分:(1)文本处理及音频特征提取对文本语料进行分词,通过分词去除不可能存在的韵律边界,基于汉字—拼音字典将分词后的语句转换为其对应的拼音串。基于语音语料,获取声学参数,如:语音短时能量、短时幅度、短时过零率、基频、质心、谱熵、信息熵、语音声母韵母等音节时长等,提取其相关波形曲线或数据。(2)语音韵律边界处的声学表现分析基于上述声学特征的相关波形曲线或数据,对语音停顿处的声学表现进行初步分析;然后基于声学特征参数的组合或转换,对汉语语音韵律边界处的各种声学表现进行进一步的分析。(3)基于声学特征的语音停顿识别首先根据韵律边界处的声学表现,构建候选声学特征集,然后通过特征选择选择合适的声学特征构建特征模板;最后利用支持向量机模型实现韵律停顿的自动识别,并对实验结果进行分析。
其他文献
近年来,随着我国城市化水平的提高,城市规模的扩大,城市发展不再是简单地筑路盖房,而是进入到一个新的阶段,即如何全面塑造城市品牌、提高城市声誉、增强城市综合实力、纳入
为评估生态环境中碳纳米材料与抗生素的生物安全性,选取了碳纳米材料中的氧化石墨烯(graphene oxide,GO)与还原性氧化石墨烯(reduced graphene oxide,rGO)和抗生素中的磺胺嘧
“农业产业园+田园综合体”是在建设“美丽中国”大道上提出的新的建设理念。拓展农业发展的多种功能,推进农业与休闲旅游、教育文化、健康养生等深度融合,发展观光农业、体
RNA和蛋白质之间的相互作用在调节生物体各种细胞过程(例如基因表达调节)中发挥着至关重要的作用,而对于它们之间的相互作用网络研究却始终得不到突破性进展。一方面,传统的RNA蛋白质相互作用预测模型多是基于它们的结构信息来构建的,但这类基于包含结构信息的小数据集构建的计算模型泛化性能不强,数据集的来源也较局限。另一方面,现阶段大多数分类预测模型都是基于单分类器的,然而机器学习的相关理论研究表明,集成分
以硝酸—氯酸钾体系分解样品,以二甲酚橙作指示剂,用EDTA标准溶液作滴定剂测定锌精粉中锌含量;沉淀用盐酸分解,以二苯胺磺酸钠作指示剂,用重铬酸钾标准溶液作滴定剂测定锌精
<正>10月20日开幕的第六届世界互联网大会上,《国家数字经济创新发展试验区实施方案》正式发布,河北(雄安新区)、浙江、福建、广东、重庆、四川等6个试点省市被授予"国家数字
SF_6气体是一种无色、无味、不易燃并且无毒的气体,由于它具有优异的绝缘性能,灭弧能力,所以主要作为绝缘气体广泛应用在高压电气设备之中。每年有超过8000吨的SF_6气体被生产应用在电气行业,但是SF_6气体是一种具有极强温室效应的气体,它的温室效应潜能值为CO_2气体的23900倍,所以寻找出SF_6气体的替代气体是电气领域中的热门课题。本文为了对潜在SF_6替代气体进行筛选,利用量子化学计算理
近年来,很多赴美国投资的中国企业由于美国外国投资委员会(CFIUS)的国家安全审查制度、过高的劳工和环保标准等原因以失败而告终。同时赴中国投资的美国企业对中国的市场限入、
在信息化时代,国家更加重视信息化进程和网络安全,网络应用型人才成为高校培养的重点之一。网络工程是一种新兴科学,它结合了通信技术和计算机技术,随着计算机网络的快速发展
2016年,是苏州博物馆新馆建成并正式对外开放十周年,为庆祝新馆开馆十周年而筹划的三个大展“蘇·宫——故宫博物院藏明清苏作文物展”“大英博物馆藏意大利文艺复兴时期素描