【摘 要】
:
汉语连续数字语音识别是语音识别研究中的一个非常重要的分支,广泛应用于工业控制、智能家居等多个领域。然而,目前的汉语连续数字语音识别系统的性能仍难以满足实际应用的需
论文部分内容阅读
汉语连续数字语音识别是语音识别研究中的一个非常重要的分支,广泛应用于工业控制、智能家居等多个领域。然而,目前的汉语连续数字语音识别系统的性能仍难以满足实际应用的需求。常用的数字识别系统是采用梅尔谱参数结合HMM(Hidden Markov Model)实现的。但是由于汉语数字语音间的混淆程度高的特性,普通的识别系统难以对其中的易混淆数字对进行有效的识别,最终导致整个系统的识别率不高。本文针对汉语数字间易混淆的问题进行了深入的研究,提出了一种多参数、多级识别策略。先采用梅尔谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用不同的参数基于SVM(Support Vector Machine)进行二次分类。在二级识别中引入了一种新的群延时谱参数RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients),其完全由语音信号的相位谱推导而来,与传统的幅度谱参数有着本质上的区别。实验结果表明,RRCGD-CC在易混淆数字对的区分上具有一定的优越性,最后结合多参数多级识别策略,将汉语数字语音识别系统的识别率提高了2.38%。另外,根据易混淆数字对之间声调和元音部分的差异,分别采用基频和共振峰作为特征参数来进行二次识别,最终的识别结果分别提高了2.01%和0.73%。
其他文献
近年来,InP材料已成为半导体领域的热点研究之一。本论文着重探讨了如下三个重要的InP基半导体光电器件:(1)高内部增益、良好频率特性和低工作电压的In0.53Ga0.47As/InP异质结
无线传感器网络是近年来物联网方向的一个热门领域,作为传统传感器研究方向的分支,无线传感器网络伴随着科技进步而快速发展。为了保证用户得到详细而全面的监测信息,网络对
目的:本研究通过将非霍奇金淋巴瘤(NHL)患者治疗前与中期治疗后(四周期化疗后)的超声参数进行比较分析,并将超声参数与PET-CT参数进行相关性分析,比较各超声参数对中期疗效的评估效能,寻找能够有效评估非霍奇金淋巴瘤中期疗效的超声参数。方法:选取以浅表淋巴结肿大为首发症状的非霍奇金淋巴瘤患者,治疗前明确病理分型,在治疗前及四周期化疗后分别两次行常规超声(包含二维灰阶超声及彩色多普勒超声)、超声造影
目的自身免疫性葡萄膜炎是一种常见的致盲性眼病,也是常见的自身免疫性疾病,其发病机制尚未完全阐明。经典wnt信号通路参与生命活动的诸多进程,在多种自身免疫性疾病中发挥着重要作用。百日咳毒素(Pertussis toxin,PTX)是建立小鼠实验性自身免疫性葡萄膜炎(Experimental autoimmune uveitis,EAU)模型常用的佐剂,可与细胞膜表面PTX敏感的G蛋白结合抑制G蛋白活
作为获取信息最重要和最基础的技术之一,无线传感网络技术得到了飞速的发展。但是当前无线传感网络存在着很多亟需解决的问题,如安装成本高,信息资源共享度低,功能升级及新任
目前广泛商用的LTE-A(Long Term Evolution Advanced,高级长期演进)技术已经能够为用户提供1Gb/s的下行峰值速率,提升了用户的最终体验。由于通信技术的不断改进推动了移动通
金融与互联网在基因层面具有先天的拟合度。得益于互联网技术在近年来持续快速的发展、渗透与普及,互联网对社会经济生活各领域的渗透与影响也在不断加深,金融行业也概莫能外
髓系白血病是成人常见的白血病类型,包括急性髓系白血病(AML)和慢性粒细胞白血病(CML)。AML是一个异质性疾病,原癌基因的突变、染色体异常发生率高。AML的治疗主要分为两个阶
为了满足未来移动通信数据流量的快速增长,第五代移动通信系统(5G)近年来已经被提出,由于6GHz以下的频谱资源相对匮乏,5G决定开拓新的频谱资源,将高频段通信作为其关键技术之
近年来,轨道交通行业迅猛发展,其快速便利的优点,使得越来越多的人选择轨道交通作为自己的第一出行方式。由于轨道交通的路权大多是独占的,可以较少担忧前方路况,因此轨道交