嵌入式双模态车载语音指令识别系统的研制

被引量 : 0次 | 上传用户：tangtongyue

【摘要】

：

在现实的汽车驾驶中,驾驶者经常要将手离开方向盘去控制各种设备,这显然给了汽车安全驾驶埋下安全隐患。将智能语音控制技术应用于车载领域,将改变汽车现有的人机信息交流方

【作者】

：

陈浩球

【发表日期】

：

2011年期

【关键词】

：

双模态语音识别车载控制唇动定位嵌入式 Linux

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在现实的汽车驾驶中,驾驶者经常要将手离开方向盘去控制各种设备,这显然给了汽车安全驾驶埋下安全隐患。将智能语音控制技术应用于车载领域,将改变汽车现有的人机信息交流方式,解放驾驶者的双手和双眼,使汽车具备更人性化魅力,体现个性化特色,提高驾车安全性。然而,虽然目前在实验环境中,语音识别技术已经具有很高的识别率,但是在实际车载的路况中,有来自马路环境、轮胎、引擎等各方面的噪声,导致语音识别率的急剧下降。噪声环境下单独依靠音频信息所得到很低的识别率,制约了车载语音控制的实际应用和发展。利用视觉信息辅助语音识别能够提高噪声环境下的语音识别系统的识别率。双模态语音识别系统采用的做法是,将音频视频信息相结合,通过加入检测视频特征,将语音识别和唇语识别相结合(我们称之为双模态识别),来提高在实际路面强噪声情况下的语音识别率。为了加快双模态车载语音控制系统的研发和实现,本文构建了一个嵌入式系统,重点在PC机平台上实现了一个双模态车载语音识别系统,为嵌入式双模态车载语音控制系统最终应用于实践提供了重要的基础。本文的主要工作有如下5点:(1)建立了一个适用于双模态车载语音控制系统的嵌入式Linux系统平台,并且为了能支持多款USB摄像头设备、增强适用性,修改了bootloader还有Linux内核中的分区大小,以便把更多的USB摄像头驱动编译进内核、支持更大的内核。(2)研究了一款在Linux系统下比较新的IDE软件开发平台“Qt Creator”,以及如何搭建一个嵌入式Linux软件开发环境。使用Qt Creator进行嵌入式Linux软件开发,将会大大便利于开发人员进行软件开发,并且加快软件开发的速度。(3)在PC机平台上设计并实现了一个基于Linux的双模态车载语音在线识别系统。系统由下面几个模块组成:识别器管理模块、语音采集模块、视频采集模块、语音特征提取模块、视频特征提取模块(由唇动定位模块、唇动特征提取模块组成)、识别模块、GUI模块。该系统以多线程的方式实现,每个模块都是一个单独的线程,以提高系统的处理效率。语音采集模块,是通过Linux的ALSA提供的API编程实现的。而视频采集模块,是通过Linux的V4L2(Video for Linux 2)提供的API编程实现的。在唇动定位模块中,先进行人脸检测,然后再通过边缘检测等手段定位到嘴唇。对于视频图像格式的转换,本设计对其算法进行了优化,并介绍了几种优化的算法,并且对唇动定位模块等进行了一定的优化。(4)研究了基于多色彩空间的自适应嘴唇区域定位算法[1],并对其缺陷进行了分析,提出了一种唇动检测算法。先通过Adaboost算法进行人脸检测,然后再通过边缘检测等方法定位到嘴唇,并对其进行了优化和提高了正确率。(5)对本系统的实验结果及性能进行评估和讨论。各个模块能够正常工作,而且它们之间能正确地进行数据的传递。对于本文提出的唇动定位方法,实验结果显示,该方法的正确率能达85%以上。

其他文献

个体化综合治疗慢性移植物抗宿主病相关干眼的临床研究

目的观察个体化综合治疗慢性移植物抗宿主病相关干眼的临床效果。方法回顾性分析2013年3月至2016年11月在我院诊治的造血干细胞移植术后慢性移植物抗宿主病相关干眼患者19

期刊

干眼症移植物抗宿主病药物治疗

突出监督导向作用动员职工广泛参与增强工会凝聚力影响力

<正>工会经审工作是推进工会改革发展的一项十分的重要工作,是时代赋予广大经审工作者一项重要职责。工会经审组织代表广大职工对工会经费资产使用和管理情况进行审查监督,加

期刊

工会经审工作工会凝聚力工会经费影响力导向作用

新疆卡拉麦里山自然保护区社区牧民野生动物保护意识调查

通过到冬牧点与牧民面对面访谈,调查新疆卡拉麦里山(简称卡山)自然保护区越冬渡春牧业现况及其对野生动物的影响、冬牧点牧民保护荒漠有蹄类野生动物意识、冬季放牧与野生动

期刊

社区牧民野生动物保护意识调查自然保护区卡拉麦里山新疆

大功率白光LED光源集成封装技术研究

随着芯片功率的增大,特别是固态照明技术发展的需求,对LED封装的光学、热学、电学和机械结构等提出了新的、更高的要求。为了有效地降低封装热阻,提高出光效率,必须采用全新

学位

LED集成封装光学设计热分析ANSYS

HPLC法测定苦木中3种活性成分的含量

[目的]建立苦木药材中3种活性成分苦木碱乙(1-甲氧甲酰-β-咔巴啉),苦木碱己(4-甲氧基-5-羟基-铁屎米酮)和苦木碱丁(4,5-二甲氧基-铁屎米酮)的高效液相色谱(HPLC)含量测定方

期刊

苦木HPLC苦木碱己苦木碱乙苦木碱丁

岭南水乡与江南水乡传统聚落空间形态特征比较研究

岭南水乡和江南水乡传统聚落都是在河网密集、气候润泽的环境中人们以水而聚的方式下慢慢发展起来的,两者所形成的空间形态有较大的相似性,都表现为浓郁的亲水情节,内部形态

学位

岭南水乡江南水乡空间形态特征比较研究

慢消化淀粉的制备、性质及其形成机理研究

淀粉是人体主要的能源物质,不同植物来源和加工方式会导致其消化特性不同。Englyst等根据在体外模拟消化特性和淀粉的生物可利用性,将其分为易消化淀粉(rapidly digestible s

学位

高链玉米淀粉辛烯基琥珀酸淀粉淀粉-脂质复合物慢消化淀粉体外消化形成机理

日本动画电影的传播分析及对我国的启示

上世纪30年代,我国的动画电影曾处在世界动画电影发展的前列,由万氏兄弟在1941年制作的大型长篇动画电影《铁扇公主》更是世界上继《白雪公主》、《小人国》和《木偶奇遇记》

学位

动画电影媒介产品产品营销传播模式媒体窗口

HY106噪声剂量计

介绍噪声剂量的有关概念,重点介绍HY106型噪声剂量计的结构、工作原理及特点.

期刊

噪声剂量幅度计权数字显示

沙苑子对运动大鼠海马氨基酸类神经递质代谢的调控作用

目的:研究沙苑子对运动大鼠海马氨基酸类神经递质代谢的影响。方法:SD大鼠随机分为安静对照组(Contrnl group,C组)、一般训练对照组(training control group,TC组)、强化训练

期刊

沙苑子海马氨基酸神经递质

嵌入式双模态车载语音指令识别系统的研制

与本文相关的学术论文