基于DSP的汉语数码语音识别系统的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xdlclub
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已成为语音信号处理技术的学科前沿,汉语数码语音识别是这前沿中重要的部分且用途很广,因此,汉语数码语音识别的研究日益受到重视。本文就是在这种情况下对汉语数码语音识别做了一些研究。 本文基于语音产生的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论。 在介绍DSP特点和TMS320VC549结构的基础上,本文提出基于DSP的语音识别系统,借鉴了TMS320C54X的评估模块(EVH),对以TMS320VC549芯片为核心的系统硬件设计进行了研究,阐述了系统的构成,分析了工作过程,采用89C51单片机对TMS320VC549的控制代替PC机的控制,并对PC机与TMS320VC549的通信方式进行改造,即将TMS320VC549的HPI口与PC机的ISA总线相连改为TMS320VC549的HPI口与PC机的并行口相通信,使TMS320VC549成为独立于PC机的系统。整个系统以TMS320VC549为核心电路进行设计,TLE2064进行放大,TLC320AC02进行A/D转换,TMCS30VC549进行训练和识别语音信号,由LCD显示结果。 针对汉语数码语音的特点,引用已有的算法进行软件系统设计,论述系统软件的设计过程。本文采用的汉语语音的端点信号的检测和清浊音信号切分方法是:短时相对能频积的方法对汉语语音信号的端点进行检测;短时相对能频比的方法对语音信号的清浊音进行切分,提高汉语语音信号切分的成功率。关键技术是引入声调的特征量作为特征参数,利用基频、基频的一阶和二阶差分,作为特征参数,以提高识别率。采用连续HMM模型,利用Baum-Welth重估、Viterbi算法进行训练和识别,实现系统软件设计。本文所做的研究工作,是为汉语数码语音识别早日进入商业化进行有效的探索。
其他文献
本文通过对荣华二采区10
期刊
高磁导率NiCuZn铁氧体材料具有较宽的工作频率范围,是宽频网络系统和抗电磁干扰领域的重要支撑材料,近年来已成为国内外研究的热点。本文采用固相反应法制备高磁导率NiCuZn铁氧体材料,针对高磁导率的目标,主要研究了主配方、添加剂、预烧温度和烧结工艺对NiCuZn铁氧体微观结构、物相和磁性能的影响。实验结果表明:ZnO可调节NiCuZn铁氧体的磁晶各向异性常数和磁致伸缩系数,改善微观结构,提高起始磁
该文设计了基于BiCMOS工艺的带有源自举CMOS输出级的Gilbert模拟乘法器电路新型结构并用于功率测量的单元前端,由此可方便组成一个完整的单相有功电能计量设计方案.为在应用
时域有限差分(FD-TD)法是在时域中求解电磁场的一种数值计算方法,它把带时间变量的Maxwell微分方程转化为差分方程来求解其电磁场各分量。自FD-TD法创建以来,它广泛应用于电磁波