基于DSP的汉语数码语音识别系统的研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:xdlclub
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类进行相互通信和交流的最便捷的手段。在当今数字化的信息时代,用数字化的技术进行语音的增强、传送、识别、合成、存储已成为语音信号处理技术的学科前沿,汉语数码语音识别是这前沿中重要的部分且用途很广,因此,汉语数码语音识别的研究日益受到重视。本文就是在这种情况下对汉语数码语音识别做了一些研究。 本文基于语音产生的模型,从时域、频域,特别是从倒谱出发,对语音信号进行分析,并结合模式识别的理论,论述语音识别的基本理论。 在介绍DSP特点和TMS320VC549结构的基础上,本文提出基于DSP的语音识别系统,借鉴了TMS320C54X的评估模块(EVH),对以TMS320VC549芯片为核心的系统硬件设计进行了研究,阐述了系统的构成,分析了工作过程,采用89C51单片机对TMS320VC549的控制代替PC机的控制,并对PC机与TMS320VC549的通信方式进行改造,即将TMS320VC549的HPI口与PC机的ISA总线相连改为TMS320VC549的HPI口与PC机的并行口相通信,使TMS320VC549成为独立于PC机的系统。整个系统以TMS320VC549为核心电路进行设计,TLE2064进行放大,TLC320AC02进行A/D转换,TMCS30VC549进行训练和识别语音信号,由LCD显示结果。 针对汉语数码语音的特点,引用已有的算法进行软件系统设计,论述系统软件的设计过程。本文采用的汉语语音的端点信号的检测和清浊音信号切分方法是:短时相对能频积的方法对汉语语音信号的端点进行检测;短时相对能频比的方法对语音信号的清浊音进行切分,提高汉语语音信号切分的成功率。关键技术是引入声调的特征量作为特征参数,利用基频、基频的一阶和二阶差分,作为特征参数,以提高识别率。采用连续HMM模型,利用Baum-Welth重估、Viterbi算法进行训练和识别,实现系统软件设计。本文所做的研究工作,是为汉语数码语音识别早日进入商业化进行有效的探索。
其他文献
该研究目的是提出一个PCtoPCIP电话系统的完整设计方案并进行实时实现.为此,研究人员和研究了H.323协议群,包括H.245、H.225.0协议.根据IP电话的基本原理关键技术,研究人员设
一些土壤可以天然地抑制某些真菌病害,该类土壤被称为抑病土(Disease suppressive soil),抑病土通常都有很强的土壤抑真菌作用(Soil Fungistasis)。目前被广泛接受的土壤抑真菌作用
稻米是全球50%以上人口的主食,其中功能稻米既是日常饮食中最大的功能食品,也是实施饮食预防疾病新战略和解决全球亚健康问题的有效途径。云南是世界稻种最大的遗传生态多样性中
胚胎干细胞是一类尚未分化的,具有自我复制能力的多潜能细胞,能通过有丝分裂进行自我更新或产生分化的子代细胞。胚胎发育是由一个受精卵发育为整个个体的过程。在胚胎干细胞分
肿瘤坏死因子(TNF)超家族成员通过结合相应的肿瘤坏死因子受体(TNF-R)参与调节细胞凋亡,细胞增殖和炎症等过程,在免疫调节中具有非常重要的作用。CD40属于TNF-R超家族重要的成
本文通过对荣华二采区10
期刊
高磁导率NiCuZn铁氧体材料具有较宽的工作频率范围,是宽频网络系统和抗电磁干扰领域的重要支撑材料,近年来已成为国内外研究的热点。本文采用固相反应法制备高磁导率NiCuZn铁氧体材料,针对高磁导率的目标,主要研究了主配方、添加剂、预烧温度和烧结工艺对NiCuZn铁氧体微观结构、物相和磁性能的影响。实验结果表明:ZnO可调节NiCuZn铁氧体的磁晶各向异性常数和磁致伸缩系数,改善微观结构,提高起始磁
该文设计了基于BiCMOS工艺的带有源自举CMOS输出级的Gilbert模拟乘法器电路新型结构并用于功率测量的单元前端,由此可方便组成一个完整的单相有功电能计量设计方案.为在应用
时域有限差分(FD-TD)法是在时域中求解电磁场的一种数值计算方法,它把带时间变量的Maxwell微分方程转化为差分方程来求解其电磁场各分量。自FD-TD法创建以来,它广泛应用于电磁波
该论文通过采用单片微型计算机与传感器系统的结合,探讨和研究了它们内在的工作原理和组织结构,并在此基础上主要研究了智能型压力变送器的基本原理及其各种智能化功能的实现