不同带宽和采样频率语音可懂度的实验研究

来源 :2008年全国声学学术会议 | 被引量 : 0次 | 上传用户:sorryhappy777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在某些极端情况如城市预警、反恐及心理战等语音远距离传播有着重要应用。例如美军在伊拉克战场上利用ATC公司的LRAD(long range acoustic device)装置,有效广播距离可达500m,在瓦解敌方意志、安抚惊慌人群方面发挥了重要作用。对远距离传播而言,语音清晰度和可懂度测试对传播效果的总体评价起着重要作用。从所查文献来看,相关工作大都集中于室内语音清晰度的研究fzl或者采用阵列方法达到远距离、高可懂度传播的目的。而远距离传播条件下的汉语语音可懂度研究较少,文献中有所涉及,给出了强噪声环境和远距离传播时汉语可懂度的主观评价结果。本文从提高能量利用效率出发,对汉语语音可懂的带宽和采样频率进行了初步研究。依据所得出的结论,可以对信号源进行频率调制,使能量作用更加集中,达到提升语音传播距离的目的。
其他文献
对同一目标噪声信号,可以有多种特征提取方法,不同的方法提取的特征矢量对目标的判别结果可能不同,特征融合的目标识别就是把这些不同的特征矢量融合起来,使对目标的判别的可信度增加。决策级融合是对每个信息源获得的属性信息分别进行特征提取和属性判决,然后将多属性判决进行融合,以获得目标的最终属性判决。
随着潜艇隐身技术的发展以及新的小型威胁目标的出现,例如水下爆破小组和武器化AUV等,在水下警戒中多置和多频带探测系统得到了重视。通常,多置系统意味着更高的检测性能、更好的定位精度和自身防护性能,因此较单置系统有更好的系统水下对抗潜力。本文讨论双置条件下运动目标的检测方法,双置系统模型由一个运动的声源和一个双置拖线阵系统组成。主动发射脉冲为单频一长脉冲,利用运动目标的多普勒偏移与静态混响进行区分。根
早期用于语音信号处理的耳蜗模型以线性模型为主,例如:Lyon和Seneff等人为代表建立的线性时不变恒Q值被动滤波器组模型等。这些模型较为简单,易于实现,被一些语音识别系统采用作为前端处理。本文考虑了舰船辐射噪声信一号的特点,对耳蜗模型进行适应性处理,模拟了耳蜗的主要生理特性,与实验数据吻合很好。
头相关传输函数(HRTF)是自由场情况下声源到双耳的传输函数。由于HRTF包含了声源定位的主要信息,将单通路信号和HRTF进行频率域相乘或时间域卷积就可以虚拟出特定空间方位的声像,所以HRTF是虚拟听觉技术的核心。现有的虚拟听觉重放系统往往采用HRTF的最小相位近似。在生成双耳虚拟声信号的过程中,为了确保最小相位近似下双耳时间差(ITD)的准确性,需要考虑双耳的最小相位HRTF函数之间的相对时间延
头相关传输函数(HRTF)是自由场情况下声源到双耳的传输函数,它与生理结构密切相关,因而具有个性化特征。在虚拟听觉的应用中,为了简化信号处理,经常假定HRTF是左右对称的。但由于人的生理结构并不一定严格是左右对称的,这可能会导致HRTF出现了左右的不对称性。本研究对52名中国人受试者HRTF的左右对称性进行分析,结果表明,在f≤1.5 kHz时,HRTF是近似左右对称的;但随着频率的升高,特别是f
虚拟听觉利用头相关传输函数(HRTF)进行信号处理,模拟出空间声源到达双耳处的声音信号,从而在听觉上虚拟出相应的空间声像。对于虚拟声的两扬声器重放,许多研究都是假定两个扬声器的传输特性是完全一致的。 但最近的研究表明,两扬声器的传输特性不匹配是导致虚拟听觉重放时侧向声像位置畸变的重要原因之一。因此,在实际应用中要特别注意两扬声器的特性匹配,而对于大批量的生产和应用,要做到左、右扬声器的特性完全匹配
语音识别系统的应用日益广泛,然而鲁棒性问题却一直是实际应用中令人困扰的主要问题之一。现实环境的多样性,训练测试阶段工作条件和声学环境的不匹配,致使系统的性能急剧下降。解决语音识别系统的鲁棒性问题,一般从模型补偿、前端降噪、鲁棒特征三个方面着手。本文介绍了两种基于MVDR(最小方差无失真响应)的鲁棒语音识别特征参数MVDR-MFCC、PMCC,以期待达到较好的抗噪性能。
在与文本无关的说话人识别方式下,高斯混合模型(GMM)是目前应用最为广泛和最为有效的识别方法,而对于高斯混合模型进行极大似然估计的一个很好的工具就是期望最大化(Expectation Maximization,EM)算法。然而,EM算法有个显著的缺陷,就是收敛速度比较慢,有时会收敛于局部最小值,而不能得到全局最优解,使得聚类效果受到影响。本文提出一种改进EM算法的GMM。EM算法是一种通用的方法,
说话人识别就是通过对说话人语音信号的分析和特征提取,自动地确定说话人的身份。说话人识别技术是交叉运用心理学、生理学、语音信号处理、模式识别与人工智能的综合性研究课题。本文提出了基于SVM的HMM训练模型。将HMM善于处理语音的动态特性的优点与SVM对静态数据的很强分类能力的优点结合起来,将SVM用于语音识别的后处理,有效地提高了系统的音节识别准确率。
随着世界经济一体化进程的加快,各国之间人员往来日渐频繁,语言逐渐成为各国人员之间交流的障碍,所以第二语言的学习成为各国人员之间交流的必须。目前,传统的教室教学模式已经很难满足人们日益加快的生活和工作节奏,计算机辅助语言学习逐渐成为人们进行第二语言学习的主要方式。本文在对目前计算机辅助语言学习的常用算法进行分析的基础上,提出了采用基于语音属性特征的发音质量评估算法,井在易混淆音素的评估上取得了好于隐