论文部分内容阅读
随着人工智能技术和智慧城市的快速发展,服务机器人逐渐走入人们的生活中,在餐饮、家庭、物流等各行业都得到广泛的应用,其可以辅助人类高效完成一些具有重复性、复杂性、娱乐性等特性的任务。这使得人们对于良好的人机交互体验有着更高要求,但传统机器人控制通常依赖于专门的指向设备和特定的操作流程,这不仅耗费大量的资源,而且对于普通用户特别是特殊人群则具有较高的使用难度。在实际的应用中,这种操作要求通常难以成立或者带来很不好的用户体验。语音交互作为自然交互方式的一种,是人类获取外界信息最自然便捷的手段,相对于其他交互方式,使得机器人能像人一样―能听会说‖、―能思会想‖。加强语音交互技术的研究,对于人们摆脱传统鼠标、键盘、触摸屏等物理设备,提高人机交互的用户体验以及实用性具有重要的意义。本文以基于服务机器人平台的语音交互技术为研究对象,在已有语音技术研究成果的基础上,针对服务机器人语音交互系统设计展开研究,并且尝试结合压缩感知技术提升系统性能,主要工作包括以下两个方面:首先,本文研究了智能语音助手技术,分析了机器人操作系统(Robot Operation System,ROS)软件架构和Android系统特性,分别设计了语音识别、语音合成、语音唤醒、文本语意理解以及机器人控制等功能模块,提出了基于嵌入式环境跨平台通信的语音交互系统,针对嵌入式环境还搭建了一个语料库,以提高机器人控制的效率,经过反复测试,在移动型和拟人型服务机器人的真实环境下取得良好的实验效果,能够满足嵌入式机器人平台移植以及智能家居环境下的用户体验需求。其次,针对语音交互系统长期进行语音监听会造成极大的资源耗损,而嵌入式设备在搭配多个外设时存储空间和计算资源将十分有限,为了保证语音交互的高效性和实时性,提出了基于压缩感知观测值的语音识别模型,该模型能够置换语音交互系统中的语音识别模块,本文充分验证了该模型在机器人控制时对语音指令所要求的识别正确率和实时性方面的性能,实验表明,在有噪声环境下能够达到95%的识别率。