车载环境下语音识别方法研究

被引量 : 0次 | 上传用户:zbczbczbczbc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半个多世纪以来,语音识别一直是人们研究的重点。语音是人类交流最常用的方式,因此采用语音识别作为人机接口的设备能够给人们的使用带来很大便利。在我国,汽车在最近的十年中越来越多的进入人们的生活,汽车给人们的生活带来的便利是多种多样的,然而现在人们越来越喜欢功能强大的汽车,这就要求车内电子设备的种类越来越多;由此造成的操作也越来越复杂,而人们在开车的时候离开方向盘去操作这些设备是很危险的,因此为车载电子设备配备语音控制人机接口成为一个最佳的选择。由于我国类似的系统还处于空白阶段,因此在这方面进行研究能填补我国在这方面的空白。首先,本文对车内语音识别技术难点之一的端点检测进行了深入了解,并仔细研究了流行的端点检测方法,由于使用环境的噪声导致了流行的端点检测算法在车内环境下检测精度降低。对此本文提出了一种基于自适应坑函数子带熵的端点检测方法,它能够很好的在车内噪声环境下实现语音端点检测。系统在某些情况下会遇到的汽车鸣笛声音对系统识别的干扰问题,本文提出了一种基于频带特征变化解决方法,成功的解决了这个问题。其次,在实际应用环境中会不可避免的遇到车内噪声,本文研究了去除噪声的两种主要方法,也就是谱减法和功率谱减法,以及它们在实际应用中应该注意的问题。本文采用了基于谱减法的噪音去除技术,成功的实现了语音增强。再次,研究了语音识别中常用语音特征参数,主要是线性预测系数和基于美尔频标的倒谱系数。噪声中被语音掩蔽的部分人耳虽然无法听到,但是却会造成语音特征参数的改变,进而造成识别率的下降。如果能够去除这部分就能带来识别率的提升,根据车内噪声的实际情况,本文提出基于听觉心理学的掩蔽效应改进的美尔频标倒谱系数,并且通过试验证明车内噪声的环境下能够对识别率有一定的提高。然后,本文对动态时间规整和隐形马尔可夫等识别方法做了详细的研究,包括动态时间规整的算法及其改进、隐形马尔可夫模型、实现中要解决的问题和基于聚类的隐形马尔可夫模型快速算法。这些工作为最终的试验识别方法、语音特征参数的选择起到了决定性的作用。最后,本文试验部分给出了试验所用的方法、步骤和语音资料库。语音识别分两个试验,一个是基于动态时间规整算法的语音识别试验;另外一个是基于隐形马尔可夫模型的试验,并且提出了一种在满足识别率的要求情况下能够提高计算速度的新方法。通过试验表明隐形马尔可夫较动态时间规整的识别效率要高一些,能够适应词汇量较大的识别系统,并且识别率能够高达98%。因此本文设计的基于隐形马尔可夫模型的车内环境下的语音识别系统能够作为车载电子设备的语音控制人机接口。填补了我国在这方面的空白,为驾驶安全提供了新的途径。
其他文献
在中国,服装买手作为服装行业的新兴职业,越来越受到企业经营者的注目,同时买手职业背后高效率的买手职能运作体系成为品牌发展的关键。近些年来,大量的国外时尚品牌进驻中国
云计算是一种将计算和存储任务分配到由大量计算机构成的云中的计算模式。在介绍了云计算和基于服务架构的概念和特征之后,提出了一种现实可行的基于服务架构的云计算四层结
在包装设计的各个视觉元素中,色彩是其中最活跃、影响力最为显著的因素,色彩能够有力地表达情感,还能够反映个人性格。因此,在包装色彩设计中,不仅要充分展示商品的品牌和个
20世纪70年代以来,经济全球化、金融自由化成为世界经济发展令人瞩目的大趋势。由于同世界的关系日益紧密,中国的经济也受到此大趋势的影响。从经济学上我们知道,管制引起对
<正>1889年2月11日,日本第一任首相伊藤博文领衔起草的《大日本帝国宪法》问世。它以1850年《普鲁士宪法》为蓝本,第一章便是《天皇》,占整部宪法篇幅的22%。颁布这部宪法的,
随着多媒体技术和数据库技术的发展,多媒体数据库的管理和数据挖掘技术都取得了很大的进展。目前,对于多媒体数据库的挖掘正日益成为研究热点。介绍多媒体数据库管理系统概念
图像配准与拼接成功的关键在于特征点提取和匹配。针对传统的sift算法提取特征点计算量大、耗时长的问题,文章采用改进后的surf算法先对两幅图像的重叠部分提取特征点,使用bb
魏光庆是随着中国当代艺术的成长而成熟起来的艺术家,“从风起云涌的1985年前后的中国现代美术思潮的策动与实践,到进入21世纪之际中国现代艺术的国际化对话”,魏光庆可以说
进入21世纪以来,随着在全国范围内彻底推行住房制度改革、停止福利住房供应,国内的房地产市场得到飞速发展。我国城镇居民的消费结构发生很大的变化,住宅消费已成为其最大的
为解决生猪规模化养殖企业对猪舍环境参数较难控制问题,设计了一种以可编程逻辑控制器(PLC)、传感器、无线模块和执行机构为硬件核心,以Kingview 6.53为软件开发平台的实时环