论文部分内容阅读
语音识别技术是一门比较前沿的学科,目前有众多的实验室和高校投身于此,这主要是因为语音识别与智能机器人、工业控制等相关领域有着紧密地联系。语音识别技术的发展十分迅猛,其主要研究内容包括预处理、特征参数提取、模式匹配等几个方面。由于语音系统的复杂性、系统较差的环境适应性、语音信号的非平稳特性、特征参数的多样性、环境噪音的影响以及词与词的特征空间混叠等一系列问题,语音识别系统在实现的过程中有着重重困难,使得语音识别过程中各项技术的研究显得非常重要。
本课题分别对语音信号的预处理、特征参数提取、模式匹配算法等进行了细致研究,主要内容有:
(1)针对现有的语音识别系统的处理方法,分别讨论了语音识别系统预处理、特征参数提取和模式匹配的几种常见方法,并根据本实验系统的需求,选取合适参数和方法来建立语音识别系统。
(2)通过分析模式匹配中多种方法的优缺点,可以看出采用动态时间规整(DynamicTimeWarping)算法,能成功解决语音信号特征参数序列比较时时长不等的问题。识别正确率是语音识别的研究重点,而识别响应速率也是决定系统实用化的关键。本课题主要从提高识别速率入手,提出对DTW算法进行改进研究,对算法的搜索路径的约束条件进行改进,将约束路径斜率改为1/3到3,同时放宽起始点路径搜索范围,极大地提高了系统运行的速度,随着识别语音数目的增多,该算法的优势更加明显。
(3)为体现本系统的实时性以及便携性,本课题在ARM上实现了可视化语音识别系统,其中包括操作系统Linux的建立与移植、可视化图形界面的建立、以嵌入式系统为基础的语音信号采集软件和语音识别系统的移植。
根据实验结果和数据分析得出以下结论,改进后的DTW算法可以作为语音识别的模式匹配算法,并且采用改进后的DTW算法能够在保证识别率基本不变的前提下,提升语音识别系统的整体速率。