兰州方言的声学特征分析和语音合成的研究

被引量 : 0次 | 上传用户:liongliong572
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人们交互最为方便快捷的方式,人们的语音交流中也夹杂了丰富的方言。因此,方言的转换与合成不但能够提高人机语音交互的和谐性和多样性,而且也能够提高人机对话过程的效率,成为了人机交互领域的一个重要研究课题。为了实现方言语音的转换,需要建立方言语音的韵律模型。本文建立了兰州方言语料库,对比分析了普通话和兰州方言的声学特征差异,建立了普通话到兰州方言转换的韵律模型,实现了普通话到兰州方言的转换和兰州方言的语音合成。论文工作对于揭示普通话与兰州方言之间的联系与区别、实现方言语音的合成具有重要的理论意义和应用价值。论文的主要工作和创新如下:1、设计了兰州方言的语料库。通过分析对比普通话和兰州方言的声、韵、调特点,结合《方言调查字表》设计了科学的文本语料库,并录制了普通话和兰州方言金城片平行的语音语料库,对语料库进行了细致的切分和韵律标注。该语料库包含:单音节字1280个,二字组词2000个,语句500句,负载句18句。其中,单音节字涵盖了四个声调的所有声韵母搭配;二字组词由四个声调以及轻声的20种组合;语句包含了兰州方言常用口语和摘录自人民日报的语句;负载句为“X说X这个X”。2、对普通话和兰州方言进行了声学特征对比分析。通过标注的基频和韵律边界,分析对比了普通话和兰州方言的单字、二字组、语句的基频和时长关系,利用模型分析法对比了模型参数的变化,对于时长,得到不同声调的时长和不同停顿级别的停顿时长关系,对比了二者的频谱质心和元音三角形。通过实验验证了普通话和兰州方言的声调调值规律和时长关系,找出了二者转换的规律。3、提出了基于五度字调模型的方言转换方法。利用五度字调模型产生兰州方言的基频曲线,通过修改普通话的基频曲线和时长,实现了普通话到兰州方言的转换。利用五度字调模型建立了单字和双字基频模型,并建立了基频补偿模型,实现基频的映射;利用统计方法建立了时长和停顿时长模型。实验结果表明,单字和双字转换的MOS评测得分在4.5分以上,语句的得分也在3.5分以上。4、利用单字拼接的方法实现了兰州方言的语音合成。利用SVR算法对语句的基频进行回归预测,得到在连续语句中不同语境下字的基频关键点和时长,利用该预测结果对单字拼接的语音进行基频和时长修正,得到较为自然的拼接合成的兰州方言。MOS评测结果为3.6,表明合成结果具有较高的自然度。
其他文献
针对基于永磁直驱风电机组的风电场无功功率/电压控制问题,研究了国内外并网规程关于无功功率平衡/电压控制方面的技术要求,并结合永磁直驱风电机组单机的无功功率调节性能和
<正>适宜大连地区栽植的甜樱桃品种主要有红灯、红艳、明珠、美早等。这些品种树势强,生长旺,抗病能力强,丰产性好,外观色泽美,肉质可口,酸甜适中,品质极佳,深受广大消费者喜
<正> 为什么各级教育行政部门对制止乱编乱印发学生教辅资料三令五申而效果不显,教辅资料尤其是练习题、试卷之类依然泛滥呢?其原因至少有三:
物体表面三维形貌测量是物理光学、实验力学、机械、电子、材料、形貌学、计算机以及数字图像处理等多学科相互交叉、紧密结合的一门新学科,在产品质量检测、加工自动化、CAD
<正>沂源县有6家企业分别在主板、境外、中小板、创业板上市,6家企业分别在"新三板"和齐鲁股权托管交易中心挂牌交易,涵盖了资本市场体系中的各层次市场,被业内人士称为资本
现代氯碱企业生产装置逐渐向大型化、复杂化、精密化、自动化方向发展,冷却塔是氯碱厂基本设备之一,合理选型是冷却塔设计至关重要的一个环节。同时,为了保证正常生产,在冷却
联动线以提高效率、降低劳动强度、提高印刷品质量为发展目标,它代表了印刷机械的信息化、自动化水平。电气控制系统是信息技术应用的载体,提高电气控制系统的信息化水平是当
伴随着科学技术的迅猛发展,高科技产品不断融入人类生活,造成了人们的体力劳动下降,脑力劳动迅速增加,以及快节奏的工作生活方式、激烈的竞争,使得人们精神过度紧张,特别是处
随着人们生活水平的不断提高,人类文明的不断进步,人们的健康意识也不断的增强。人们逐渐认识到体育锻炼在增进人的身心健康中起到了非常重要的作用。而太极拳作为中华武术之
随着我国城市化进程的不断加快及交通条件的不断改善,城市客车的社会需求及档次要求也大大提高。近年来,我国的客车技术虽已取得了较大的发展,但与西方发达国家相比仍有较大