基于深度学习的语音质量评价方法研究

被引量 : 0次 | 上传用户:chenfj01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多种多样的语音传输和通信系统在人们日常的信息交流中扮演了极其重要的角色,而语音系统的输出语音质量优劣是评估其性能的决定性因素。主观语音质量评价方法虽然可靠,但实施过程耗时耗力,灵活性差。基于输入-输出方式的客观评价方法和主观评价相关度可达到很高,但其需要实际中较难获得的原始输入信号作参考,所以寻求高性能的基于输出方式的客观语音质量评价方法是十分迫切的。本文通过研究基于输出方式的客观评价方法,提出一种基于深度学习的新方法,即首先对预处理后的语音提取特征,然后利用已训练好模型参数的深度信念网络将特征映射到对应的语音质量等级区间,以获得客观预测的语音质量结果。本文的主要内容如下:(1)对语音预处理后,进行语音活动检测,对检测得到的语音帧特征提取,排除静音帧,有助于提高语音质量评价的准确性;(2)将改进的Gammatone频率倒谱系数与感知线性预测倒谱系数作为语音的特征,对人耳听觉感知的模拟效果更佳,改善了客观评价结果与主观评价的相关性;(3)引入深度学习来进行语音特征的学习,并将特征映射到非均匀粒度法划分的质量等级区间,以得到预测结果,同时与浅层学习模糊支持向量机作对比,实验结果分析表明将深度学习应用于语音质量评价系统要优越于浅层学习。通过对多个语音样本进行测试,可证明所提出的基于输出方式的语音质量评价方法是有效的,并且具有很好的灵活性和鲁棒性,预测所得结果和主观评价有较高的相关性,最高可至0.91。
其他文献
柴田文江(Fumie Shibata)是目前日本最为活跃的工业设计师之一。作为一个女性,她独特的“柴田温柔风”风格的作品,“像个母亲一样,温柔地照顾消费者”,成为婴幼儿、妇女等使
清代著名医家陈士铎在癫痫的诊疗上经验丰富,其所著《辨证奇闻》从多个角度探讨了癫痫的病因病机,认为癫痫的主要病机为痰火扰心、心脾两虚。但其关键病机为脾胃损伤而生痰,
硒(Selenium,Se)是人体必需微量元素,与人体健康密切相关。我国72%的土壤硒含量较低造成当地人体硒摄入量不足,目前由缺硒引起的健康风险已成为我国环境生态问题之一。在自然
分析我校和全国轻化工程学科发展中存在的传统弊端,通过引入CDIO理念,提出了基于CDIO理论的轻化工程人才培养模式的教学改革模式,从课程体系、研究性教学型实验课、实习教学
<正>早在1984年2月27日,国务院发布的《关于在我国统一实行法定计量单位的命令》(以下简称《命令》)中明确规定:"我国的计量单位一律采用《中华人民共和国法定计量单位》","
教师的体态语在英语教学中显著影响学生的学习效果。恰当地运用体态语对提高课堂效率起着非常重要的作用。在初中英语教学中,教师要恰当运用体态语艺术,注意手势语、面势语以
对工程物资材料,采用业主自行采购模式具有保证质量的优势,但增加了工程结算的工作量,也会降低招标竞争的范围和有效性,应逐步减少这种模式,纳入整体招标范围,直接由市场竞争
为了更加高效和快速替换模块化多电平换流器的故障子模块,提出一种基于动态调节的冗余子模块投入策略。利用冗余子模块进行了电压补偿,同时在每个控制周期内对替换子模块的导
目的分析68例糖尿病足患者感染病原菌的特点及其耐药性并总结患者入院时白细胞数及糖化血红蛋白情况。方法回顾性分析2005年1月~2008年7月从糖尿病足分泌物中分离的细菌特点及
<正>尹文是战国中叶一位崇道而尚法、重名而善辩的稷下名士,其学脉归属历来为注家所关注,却也因此在众说纷纭中愈益暧昧不明。今对尹文之学再作分辨,以就教于方家。因着尹文