基于麦克风阵列的语音识别系统设计

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:majixiong0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,“智能语音识别”为核心的人机语音交互处于飞速发展中,基于麦克风阵列的远场语音识别技术应用广泛。在实际应用场景中,语音信号不可避免的夹杂各种噪声,严重影响语音识别的准确率。优秀的语音识别系统,不仅其自身模型性能要表现良好,而且与用来采集信号的麦克风阵列、以及输入的语音信号质量密切相关。本文设计了用于语音信号采集的麦克风阵列模块;以该麦克风阵列为收音装置,提出了一套语音增强算法;集成麦克风阵列模块、语音增强模块、和语音/文字转换模块,完成语音识别系统。测试结果表明,对于原始的带噪语音,本文所完成的语音识别系统,比应用传统算法的语音识别系统,准确性与稳定性都有显著提升。本文所开展的研究内容如下:1、麦克风阵列模块设计。进行了麦克风阵列结构设计;完成了麦克风阵列硬件电路设计,包括麦克风选型、多路选择电路设计、信号放大电路设计、模数转换电路设计及嵌入式MCU设计。2、语音增强算法研究及测试。该算法包括四部分:自动增益控制、自适应降噪、语音端点检测、声源定位及波束形成。其中,自适应降噪与语音端点检测对后续语音识别准确率起关键作用。原始的带噪语音,经过本文提出的改进谱减法降噪算法,基于双门限法的能熵比语音端点检测算法和声源定位及波束形成算法处理后,可以分离出纯净人声语音,便于后续语音识别。3、集成麦克风阵列模块、语音增强模块、和语音/文字转换模块,完成语音识别系统。基于MFC库,完成了系统应用界面设计。对基于麦克风阵列的声源定位算法,和语音/文字转换模块进行测试。测试结果表明,语音信号经过增强处理后,语音识别的准确性与稳定性都有显著提升。
其他文献
热解炭是一种类陶瓷的硬脆性材料,因其具有出色的化学稳定性以及良好的生物相容性等特点,在生物医学领域常用作人工机械心脏瓣膜的涂层材料。植入人体的人工机械心脏瓣膜工作于复杂的生理环境当中,且瓣片表面热解炭涂层长期承受血流的循环冲击作用,涂层表面可能会因空化气蚀等原因的影响出现微小裂纹缺陷。随着时间的推移,这些微小裂纹可能会扩展形成宏观裂纹,甚至导致瓣片发生断裂,致使人工机械心脏瓣膜可靠性降低甚至完全失
上肢功能障碍是大部分功能障碍患者都面临的问题,由于传统康复治疗无法对患者的运动神经产生足够的刺激,越来越多的研究者开始关注脑机接口神经康复领域。基于运动想象的虚拟现实上肢康复系统,利用感官刺激可以达到神经康复训练的效果,成为了当前热门的研究方向。但是目前虚拟现实系统的开发周期长、构建成本高,且运动想象信号解码中最经典的共空间模式(Common Spatial Pattern,CSP)算法,由于受试
随着骨缺损再生医疗技术的提升,骨移植修复已经成为仅次于输血的需求量最大的移植物。其中,骨修复材料单价是相同质量下黄金价格的2.4倍,被业内人士称为“骨黄金”。基于天然骨的仿生骨修复是最新的骨科医疗技术,其中,猪股骨是仿生骨修复材料的主要来源,但是尚未有一套完整和科学的猪股骨切削加工技术与加工设备,因此本文研究的猪股骨切削加工技术与加工设备给骨科医生和骨损伤患者带来了新的希望。本文主要针对骨修复材料
软体机器人主要由柔性材料制成,可通过主动改变自身形态来适应外部环境,对不同形状的物体表面适应性高、人机交互安全。软体仿生手作为软体机器人的分支也成为众多学者研究热点,然而现有软体仿生手存在制备工艺复杂、驱动性能一般、控制复杂等问题,尤其在应用研究中,手指运动存在灵活性差和横向承载力较低等不足。针对上述问题,本文将刚性结构应用于仿生手驱动器的设计当中,提出一种刚柔复合软体仿生手结构,对其结构设计、样
学位
相比于传统控制系统,网络控制系统拥有更好的交互性、扩展性和方便性。但由于数据量的激增和网络资源的有限,数据传输不可避免地存在网络诱导延迟和数据包丢失等问题,并且这些问题具有一定的概率特征。同时,由于系统运行环境中的噪声和不确定因素,系统参数一般具有不确定性。因此,本文针对网络控制系统中的网络诱导时滞、数据丢包、随机性、不确定性问题进行研究,基于李雅普诺夫第二法、鲁棒控制、积分不等式等方法,分析系统
关节式坐标测量机(Articulated Arm Coordinate Measuring Machine,AACMM)具有测量空间大、灵活性好、便于现场测量等优点,广泛应用于逆向工程、汽车车身设计、现场零件检测等领域。但是由于关节式坐标测量机的串联机械结构特点,各个关节上的误差会被累积并逐级扩大,最终导致测量机精度不高。总结国内外研究现状可知,目前改进关节式坐标测量机精度的措施集中于提高测量机结
近年来,人们对声子晶体(phononic crystals,PCs)在减振降噪、声学元器件设计等方面的研究取得了一些成果。但因为结构和材料固定后,声子晶体的带隙也就随之确定,为了使带隙频率满足不同使用环境频率的需求,越来越多的研究人员开始在带隙调控方面进行探索,但目前仍存在调控操作不便、调控不连续等缺点。本文基于形状记忆合金(Shape Memory Alloys,SMA)的材料参数(杨氏模量)和
学位
学位