论文部分内容阅读
随着技术的进步,普通的音视频资源已不能满足人类社会的需求,人们希望通过各种搞怪的声音娱乐大众,也希望建起与大自然物种间沟通的桥梁,因此各种语音信号系统的研究已迫不及待。语音信号处理是研究数字信号处理技术对语音信号进行处理的一门学科。它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以便高效的传输或储存语音信号信息;二是要通过处理某种运算以达到某种用途的要求,例如人工合成出语音、辨识出讲话者、识别出讲话的内容等等。因此,在研究各种语音信号数字处理技术即是建立既实用又便于分析的语音信号产生模型和语音信号感知模型等。与外界生命体之间的通信一直是人们有待突破的瓶颈,语音变调,即是在保持音频文件播放速度不变的前提下,按照某种算法对说话人的音调进行调整,从而实现音调的升高或降低,要想达到不同音调的输出就得调整信号的音频频率,因此要想听到各利不同动物的声音就得改变原始语音信号的基音频率,而要想随时听到现实世界中千变万化的声音,达到机器人喜、怒、哀、乐的表情与以声音的结合,除了要变调还要合成,以目前的技术水平达到这一层次还存在很多缺陷,要想拥有完美的机器人语音,还有很长的路要走。变调算法是一种用途广泛的音频处理手段,但有关的技术资料很少,并且介绍得不详细。本文提出了一种时域实现的算法,能有效实现变调不变时间,并达到较好的相位连续性,实验证实效果良好。语音识别的目的是研究出一种具有人类听觉功能的机器,能够直接听懂人的讲话,理解人的意图并做出反应。将输入语音的特征参数同练得到的语音模式库进行比较分析,从而得到识别结果。文中主要论述了几种匹配识别算法,在大词汇量连续语音识别系统中,为了提高识别正确率需要使用语言模型,利用语音识别单位之间的连接时的相互制约关系,采取统计方法与语法相结合的方法建立语言模型,达到限制识别器译码的自由度,目前还很难用好。本论文重点研究了语音变调算法实现及语音合成的一些理论应用,详细分析了语音短时处理中的中值滤波与线性滤波相结合去除变调噪声的效应以及语音录放系统、语音摇控系统实现机制,并加入语音合成识别算法理论。最后通过实际应用中的变调学说话得机器人来结束论文,有理有据。在深入研究了变调算法后,通过对比,发现时域调制法是一种简单的变调方法,是最早改善音频的方法。通过将信号横向移动实现变调,原理为:对时域信号进行调制,实现将原信号的频谱搬移,从而实现频率的升高或降低,达到变调的效果。该方法容易产生信号失真,变调后会有金属声和噪声,但使用线性与中值滤波相结合能去掉跳跃大的信号,去掉性号中粗糙部分,使信号接近平滑,有比较大的改善