基于麦克风阵列的语音识别系统研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:w01225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术在电子、通信、工业控制、计算机和信息服务等领域有着广泛的应用和光明的发展前景。未来语音交互系统将成为人机对话的普通工具,故对语音识别的深入研究,顺应了市场的要求,同时也将大大推动语音技术的发展。人与机器交流和沟通壁垒的解决与突破,将为人类提供更加方便、自然、快捷的操作界面及更友好的交互方式。  本文在分析了语音识别的研究发展现状基础上,提出了语音识别的改进算法,将矢量量化(VQ)的码本设计进行改进和优化并与最小二乘支持向量机(LSSVM)结合来共同构建VQ-LSSVM二次语音识别模型。考虑到高信噪比的纯净语音信号对语音识别系统的影响,在语音识别系统的前端引入基于麦克风声源定位的语音增强算法。具体是利用麦克风阵列的声源定位方法来锁定有效声源方位参数,然后根据参数对声源方位作可控波束指向性增强,将增强后的语音信号输入语音识别系统进行语音识别。最后将前端语音增强及后端系统模型识别算法植入TMS320C6713 DSK硬件平台进行实验仿真和验证完成系统设计。  本文的创新成果如下:  (1)将搜索空间预估计的波束指向性增强算法引入到语音识别系统,用以语音增强来提高识别系统输入信号的信噪比。具体是先利用搜索空间预估计声源定位算法得到有效声源的方位参数,再由此参数对期望方向上的信号做波束指向性增强,从而最大程度抑制了干扰。该算法作为语音识别系统前端用以语音增强,具有计算量小、抗干扰能力强的优点。  (2)本文在传统已有的语音识别系统基础上,采用LBG和遗传算法(GA)相结合的码本设计,并将VQ码本设计与LSSVM模型相结合构建VQ-LSSVM语音识别系统模型。系统通过训练先得到VQ模板,再求出VQ码字与特征参数的最小失真测度,并将该测度来训练LSSVM模型,最终得到系统训练模板。识别时先用VQ模板对待测语音信号进行初次识别,对于落入设定阈值内的矢量再用LSSVM模型进行二次识别,最终得到系统识别结果。  最后,论文给出了语音识别系统在MTALAB及 DSP平台上的实验结果和系统性能分析,并对课题的工作进行了总结,指出了下一步研究工作的思路以及改进方向。
其他文献
本研究以中国科学院海伦农业生态实验站土壤空间移位长期定位试验为平台,于2005-2007年种植玉米,在两种施肥水平下研究了土壤有机质(SOM)含量不同的黑龙江北安(SOM11)、黑龙江
学位
有花植物进化出如此丰富多样的花部特征仅是用来实现一个功能——交配成功或繁殖成功。因此,进化植物学家的中心议题之一就是去弄清有花植物交配对策和花性状多样性的起源和选
钾是作物生长发育的必需矿质元素,缺钾降低大豆产量和营养品质。硅是植物的有益元素,在低钾胁迫条件下,硅对大豆生长是否有改善作用还未见相关报道,本研究以对低钾敏感的不同
浮点乘加部件(Multiply-Add Fused, FMA)是高性能微处理器中的核心运算部件之一,它的速度与功耗对整个微处理器性能具有很大的影响。随着应用技术对低功耗的要求不断增加,研
长期演进(Long Term Evolution,LTE)系统是近几年来3GPP(3rd Generation Partnership Proiect)组织启动的最大的新技术研发项目,是无线通信技术与宽带无线接入技术的融合。  
光子晶体是一种亚波长尺度下,两种或者两种以上介质周期或准周期排布的材料,具有光子带隙、负折射、抑制自发辐射等特点,可以在微纳尺度下实现光调控,有望实现低阈值甚至无阈值光
为了配合北京市自然保护区体系规划建设、自然风景区内自然保护小区的规划建设和生物多样性保护规划与行动计划的制定等工作,在国家自然科学基金委项目“北京主要自然保护区
扩展F(Spread F)是出现在电离层F层高度范围内的电子密度不规则结构。扩展F出现时可导致穿电离层传播的无线电波发生闪烁现象,从而对卫星通信、导航定位和卫星遥感等造成严重影
随着集成电路(IC)进一步往深亚微米方向发展,静电放电(ESD)保护成为一个日益重要的问题。当集成电路工艺发展到纳米尺度时,器件的工作电压,击穿电压等都进一步降低,然而对ESD
通过利用高效液相色谱-质谱联用技术,研究110个不同基因型(包括3个种和5个种间杂种)葡萄品种的花色苷含量和成分特点。在所有品种中,最多鉴定出29种花色苷。对葡萄的花色苷总量