基于音频特性的语音可懂度评估

来源 :太原理工大学 | 被引量 : 5次 | 上传用户:HYB1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代信息技术的快速发展,已经有越来越多的语音信号处理技术融入到我们的生活中,例如语音识别、语音增强、智能语音交互等,这些技术的成熟极大的方便了我们的日常生活和工作。而如何准确的评估语音性能,也一直是众多学者研究的热点,现如今语音性能的评估主要从语音质量和语音可懂度两个方面进行测评。一个准确有效的语音评估方法不仅可以提升通信系统的性能,而且可以间接检验语音增强算法的性能。语音的主观评价拥有人类对语音信号最真实的感受,然而主观评价费时费力,更是无法应对如今海量语音数据的评价需求。近年来,以计算机信息处理技术为核心,以最接近人类主观评价分数为目标的客观评估方法成为了研究热点。本文首先回顾了语音信号的基本知识和语音可懂度评价指数的发展历程。简述了现如今先进的语音主客观评价方法,分析客观可懂度评估方法的改进过程和评估思想,这对本文后面的研究提供了启发。本文首先将基于人耳耳蜗基底膜听觉特性的Gammatone滤波器组被应用于频域激励谱滤波,结合加权频带信噪比方法计算语音信号激励谱能量失真,相对于传统方法,改进的语音可懂度评估方法在Babble、Car、Street背景噪声环境下与主观评价分数的相关系数都有了明显提升。同时,本文还研究了元音和辅音对语音可懂度的相对贡献,在归一化协方差评价方法的基础之上,以语音所有频带信噪比(Signal To Noise Ratio,SNR)的相对均方根(Root Mean Square,RMS)值为阈值进行频域分段。语音频段被分为两个等级,高信噪比频段和低信噪比频段。对两种频段的语音信号采用归一化协方差方法(NCM)计算各自的语音可懂度客观评估分数。实验结果显示高信噪比频段语音含有更多的语音可懂度信息且与整体评估分数接近。同时,统一模型的提出结合了两段语音可懂度的相对贡献,当权重系数为0.2时,所提模型的评价结果与主观评价分数拥有高相关性。
其他文献
<正> 我国历代农书有书目可查的逾五百种。其中流传至今的约二百五十余种。在为数众多的农书中,篇幅宏大、有一定深度和广度的大型综合农书,是众所周知的北魏·贾思勰《齐民
目的目前模糊测量方法难以处理存在纹理平坦区域时的局部模糊测量。针对该问题,提出一种基于BP(back propagation)神经网络的图像局部模糊检测方法。方法该方法采用所有奇异
通过构建高校教育用地集约利用评价指标体系,以河南省某高校为例,对新老校区目前和规划的土地利用集约情况进行评价。结果表明,当前新校区的土地集约利用水平较低,属于粗放利
本文主要分析了RTK技术,对其工作步骤进行了简要介绍,阐明其技术特点。结合某测量工程实例详细描述了RTK技术在地质勘查中的具体应用,总结了地质勘查中RTK技术的优势,以期能够起到推广RTK技术的作用。
教育公平是一个永恒的话题,是人类崇高的价值追求。高考直接关系到教育发展规划的方向,是推进教育公平的必然要求,加快异地高考制度改革,既是人民群众的期待,也是教育改革的
目的探讨欧文.亚隆的团体心理治疗模式,在《医护心理学》的教学过程的作用。方法将学生分为团体心理治疗组(10人)和观察组(32人),采用团体心理教学模式进行教学。结果教学结
现代城市火灾隐患、夏季高温、冬季雾霾及灰尘噪音等问题日益严重,细水雾不仅是一种绿色环保的灭火手段,还具有快速降温、高效除尘和环境美化等作用和功能,非常适合在宜居城
本文针对广西某矿区铜铅锌硫铁矿进行了详细的勘察,并且做出了详查报告,希望能够对类似矿藏的勘察工作具有一定的借鉴意义.
后勤动员对战争的胜负具有举足轻重的作用。高技术战争的后勤动员要求以后勤科技动员为重点,以成建制动员为主要组织形式。我国做好高技求战争条件下后勤动员工作,必须大力加
作为民族文化的历史沉淀和结晶,文化意象在不同语言的诗歌中广泛存在。针对诗歌文化意象在翻译过程中会出现不同的文化亏损情况,现有研究重点多放在文化意象存在的两种文本本