论文部分内容阅读
语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已成为语音信号处理技术的学科前沿,汉语数码语音识别是这前沿中重要的部分且用途很广,因此,汉语数码语音识别的研究日益受到重视。本文就是在这种情况下对汉语数码语音识别做了一些研究。 本文基于语音产生的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论。 在介绍DSP特点和TMS320VC549结构的基础上,本文提出基于DSP的语音识别系统,借鉴了TMS320C54X的评估模块(EVH),对以TMS320VC549芯片为核心的系统硬件设计进行了研究,阐述了系统的构成,分析了工作过程,采用89C51单片机对TMS320VC549的控制代替PC机的控制,并对PC机与TMS320VC549的通信方式进行改造,即将TMS320VC549的HPI口与PC机的ISA总线相连改为TMS320VC549的HPI口与PC机的并行口相通信,使TMS320VC549成为独立于PC机的系统。整个系统以TMS320VC549为核心电路进行设计,TLE2064进行放大,TLC320AC02进行A/D转换,TMCS30VC549进行训练和识别语音信号,由LCD显示结果。 针对汉语数码语音的特点,引用已有的算法进行软件系统设计,论述系统软件的设计过程。本文采用的汉语语音的端点信号的检测和清浊音信号切分方法是:短时相对能频积的方法对汉语语音信号的端点进行检测;短时相对能频比的方法对语音信号的清浊音进行切分,提高汉语语音信号切分的成功率。关键技术是引入声调的特征量作为特征参数,利用基频、基频的一阶和二阶差分,作为特征参数,以提高识别率。采用连续HMM模型,利用Baum-Welth重估、Viterbi算法进行训练和识别,实现系统软件设计。本文所做的研究工作,是为汉语数码语音识别早日进入商业化进行有效的探索。