一种用于强噪声环境下语音识别的含噪Lombard及Loud语音补偿方法

来源 :声学学报 | 被引量 : 0次 | 上传用户:hbsheng111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对语音识别中由于强噪声的影响而引起的Lombard和Loud效应进行研究,提出了基于训练数据的加性噪声和Lombard及Loud效应的联合补偿法。对于加性噪声是从谱减法的逆向角度对训练数据在频谱域采用谱加法;对于Lombard和Loud语音,则采用基于隐马尔可夫模型(HMM)状态标注的训练数据补偿,该方法同时考虑Lombard和Loud语音不同声学单元的不同状态在倒谱域的多种变化和多种变异情况下不同声学单元的音长及相对音长的变化。这种基于数据的多模式补偿使模型自动适应多种噪声和语音变异情况,在强噪声环境下具有很强的鲁棒性,并且不影响识别系统在正常环境或正常发音时的识别性能.同时,由于补偿是在训练过程中得到,不增加识别时的计算复杂度。 Aiming at the Lombard and Loud effects caused by the strong noise in speech recognition, a joint compensation method based on the additive noise of the training data and the Lombard and Loud effects is proposed. For additive noise, the training data is spectrum-added in spectral domain from the perspective of spectral subtraction. For Lombard and Loud speech, training data compensation based on Hidden Markov Model (HMM) state labeling is used. The proposed method also considers Lombard And Loud speech different acoustic units of different states in the cepstral domain of a variety of changes and a variety of variations under different acoustic unit length and relative pitch length changes. This data-based multi-mode compensation automatically adapts the model to a variety of noise and speech variations and is robust against strong noisy environments without affecting the recognition performance of the recognition system in normal or normal speech. Since the compensation is obtained during the training, the computational complexity of the recognition is not increased.
其他文献
在美索不达米亚平原的神殿墙上,苏美人用不同颜色、不同大小的小石子错落有致地排列组合出美轮美奂的太阳狗图案。据说,这是迄今发现的最早的马赛克建筑装饰。到了古罗马时期
1926年,爱因斯坦来到美国加里福尼亚讲学。他忽然产生一个奇怪的念头,非常想见见美国当时红遍天下的电影演员、滑稽大师卓别林先生。卓别林一边迈着他那八字步,一边寻思,“
栽培平菇,培养料含水量是一重要指标。过高,通气性差,菌丝生长缓慢,易造成杂菌感染,甚至发酵腐烂;含水量过低,菌丝生长稀疏,菇蕾形成迟缓, Mushroom cultivation, culture
目的:研究应用护患沟通护理方式在高血压治疗中的效果研究与应用价值.方法:现随机抽取70例2020年10月至2020年12月我院收治的高血压病人进行调查研究.将病人按照入院先后顺序
与专业指导性护理相比,全科护理更广泛、更详细且优化护理,全科护理人员具有更丰富的知识点和更复杂的操作点.全科护理人员是真正的医疗“多面手”.全科护理在临床环境中的应
通过对不同类型弱势群体的信息行为特点的研究,分析其处于数字鸿沟边缘的原因,建议图书馆应当根据信息弱势群体信息行为的特点,设计出对他们有针对性的知识援助的体系.
自贡市是四川省一座老工业城市,由于传统体制的制约,产业结构调整滞后,国有企业大面积亏损,使昔日辉煌的盐都变成全省城市经济的“重灾区”。成立于1984年的自贡市分行,到19
中国人民银行货币行政司透露,利率市场化将进一步推进,年内可望通过放开外币贷款利率,进一步提高农村信用社利率浮动幅度等举措,提高我国利率市场化程度。中国利率市场化改
呼吸机设备主要运用在急救、治疗和复苏环节中,在临床中需要依照患者实际状况开展,设置出较为合理、科学的通气模式.在运用呼吸机设备的时候,需要依照患者病况对参数进行选择
弱势群体是一个需要全社会共同关注和扶助的特殊群体,对弱势群体的关注和关心正在逐步成为全社会的共识.作为公益性的社会文化教育机构——公共图书馆,关爱社会各界人士,尤其