论文部分内容阅读
传统的人机交互是通过键盘和显示器,人们通过键盘或鼠标输入,通过视觉接收信息。语音是人类最重要、最有效、最常用、最方便的相互传递信息手段。为计算机增加语音交互方式,使人机交互像人与人交流那样的自然友好,这种自然和谐的交互技术已经成为人机交互领域的发展趋势之一。
针对当前科普领域展品对趣味性、交互性和科学性的要求,本文设计了一套语音互动系统。通过系统中自然和谐的语音交互技术,以及趣味性的互动娱乐游戏,观众能够在高层次、智能化的互动趣味游戏中深刻地了解科学知识。
本文在对语音互动系统功能及关键技术分析研究的基础上,对系统进了详细设计并初步实现了系统的功能。第一,本文首先研究分析了语音信号的预处理技术,针对语音信号中无声段噪声信号的影响,设计了Fir滤波器成功消除该类噪声信号,并设计了双门限算法流程,实现了对语音信号的端点检测;第二,研究了语音信号中基音周期特征的提取方法,在对比了常用的基音周期提取方法的基础上,提出了采用适应性广泛的自相关函数法提取基音周期特征的方案,并对自相关法提取基音周期时受共振峰影响这一难点问题进行了研究,采用了三电平削波法解决了该问题,同时减少了基音周期的提取时间;第三,在准确的基音周期提取和端点检测的基础上,采用峰值搜索法对语音信号的基音脉冲进行了准确标注,在此基础上采用基音同步叠加法中的TD-PSOLA算法修改了原始语音信号时长和音高所代表的韵律特征,实现了语音变换功能;最后,详细设计并初步实现了语音互动系统。结果表明,该系统具有一定的科学性和娱乐性,达到了科普展品寓教于乐的目的。