一种改进的语音质量客观评价算法的研究与实现

来源 :东北大学 | 被引量 : 1次 | 上传用户:rkn7621278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今的社会生活中的各个方面都涉及到了语音通信技术,而语音质量评价则是衡量其通信系统性能的有效方法。其按照评价主体,可分为主观评价和客观评价。主观评价是以人为主体,其真实的反映了人的主观感受,但是当数据量较大时也存在着测量误差大的缺点。客观评价就是用机器来判别语音质量的好坏,具有判别时间短,操作性强,重复灵活性好等优点。目前,国际电信联盟推荐的话音质量客观评价算法是感知语音质量评价(Perceptual Evaluation of Speech Quality,PESQ),主要应用于通信网络和编解码系统的测试,其算法的建模是以人的听觉和感知特性为依据,用程序化的方法对被测的语音系统进行客观的评价,并最终得出与主观评价的耦合度。本文通过查阅大量文献,介绍了语音质量评价的发展过程,并且对PESQ算法形成前的一些算法做了较为深入的研究。在分析P.862标准给出的PESQ算法的基础上,对PESQ算法中的延时校准和听觉模型部分做了改进,提高了语音定位的精确度和客观评价主观耦合度,并且通过谱域变换方法的改进,降低了算法的复杂度,提高了运算效率。目前语音质量评价系统主要有Malden和Psytechnics等公司的产品,其特点是功能全,数据的形象度高,但是其成本高,设计相对复杂。针对上述情况,本文以改进的PESQ算法为核心,以Malden公司的DSLA产品为对比原型,设计了一体化语音评价系统,其特点是廉价,实时性好,具有可移植性。并使用虚拟仪器进行系统的设计,对大量的语音数据进行了系统实现,实验结果表明,测试结果准确,能实时显示评分过程的相关参数,并进一步通过传输函数、电平信息和幅频响应等测试数据分析了被测语音设备的性能。
其他文献
脑—机接口(Brain—computer interface,BCI)是建立在人脑与计算机之间的通信系统。通过它,人们能够直接地利用脑部信息来表达想法或控制设备,而不需要语言或动作。BCI不仅可以
心脏病是威胁人类健康的最严重的疾病之一,我国人口的心脏病发病率很高而且呈逐年递增的趋势,所以心脏病的防治和诊断已成为当今医学界面临的主要问题。心血管疾病是最主要疾病
现行的视频采集传输系统是以网络视频服务器为代表的有线视频传输,但在复杂的地理环境中,有线网络视频传输受难于搭建、成本过高、建设周期过长等瓶颈约束,很难满足现实的需
伴随着智能电网在能源系统中的定位和作用提升,以清洁能源为主导的分布式能源得到了快速发展,承载分布式能源及其配套储能装置的智能微网得到广泛重视,并逐渐呈现能源、储能、用电一体化的区域性发展趋势。电动汽车作为智能电网发展下的新型用电设备,其大规模接入与复杂、随机性运行特征将对区域智能微网乃至智能电网造成不容忽视的影响。因此,本文的研究目的旨在围绕电动汽车大规模接入区域智能微网这一研究热点,系统性的分析
根质膜具有重要的生物学功能,它参与了根响应脱落酸(ABA)的一系列活动。尽管已经有很多有关ABA影响根的生长和发育的报道,但是在蛋白质组水平上研究参与ABA信号转导及相关活动
学位
射频/微波滤波器是现代通信系统中必不可少的组成部分。随着现代移动通信和卫星通信技术的迅速发展,可用的频谱资源日益紧张,系统对滤波器的技术指标要求,包括矩形度、体积和重
网络编码技术通过在中继节点处对数据包进行编码来提高中继网络的吞吐量。在此基础上,物理层网络编码(Physical Layer Network Coding, PNC)将数据包的编码运算放在物理层上
三维数据作为一种新的数字媒体形式,在近几年引起了人们的广泛关注。在数字化现实世界的过程中,三维数据具有以往二维图像所无法比拟的优势,它可以精确记录物体表面的几何属性、
学位
世界的发展日益更新,人们交流的区域也越来越广,随之带来的是语言学习的迫切需求。计算机辅助语言学习通过集成语音识别技术,将在语言学习中扮演日益重要的角色。但要更好的替代