论文部分内容阅读
随着机器人技术的日趋成熟,服务机器人已经逐步走向千家万户。语音作为最方便、最快捷的输入方式,有着无与伦比的优越性,具有语音交流功能的服务机器人越来越受到用户的欢迎和喜爱,研发适合走进家庭的言语交互机器人成为服务机器人发展的必然趋势。言语交互机器人的开发难点在于语音识别,尤其是带有口音的语音识别。因此,本课题在建立自发口语语音识别模型的基础上,设计了面向机器人的言语交互系统。主要研究工作和成果如下:(1)概述了言语交互的基础理论。首先,对人机交互技术进行了概述;然后,对语音识别技术进行了详细的分析,阐述了声学模型和语言模型的建模方法;最后,对语音切分技术进行了叙述。(2)提出了面向机器人的言语交互系统设计方案。首先,根据项目开发需求,分析了系统的总体目标,并对系统进行了功能性和非功能性需求分析;然后,根据需求分析,进行了系统概要设计,包括系统框架和系统流程;最后,研究了系统的开发和运行环境,分析了系统的安全性问题。(3)实现了言语交互系统。首先,对自发口语语音识别模块进行建模,采用最大相似度原则训练基于GMM-HMM的声学模型,包括单音素模型和三音素模型的训练,并采用大量的日常生活用语文本语料建立基于N-gram的统计语言模型;其次,利用信号的时域特征分析和单音素语音模型实现自动切分技术,解决口语发音中的不连贯、犹豫停顿的识别问题,并利用多线程解码技术提高语音识别效率;然后,实现了客户端登录、注册、录音和特征提取功能的设计;最后,根据系统架构,实现了服务端的详细设计,包括信息管理模块、解码器、在线对话模块和文件存储模块。实验结果表明,本言语交互系统在复杂噪声背景下有很好的识别效果,具有很好的鲁棒性、安全性和实时性,为智能服务机器人平台提供了核心模块。