基于ARM-Linux的抗噪声语音识别技术研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:popwoool20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型(Hidden Markov Model,HMM)与动态时间规整(Dynamic Time Warping,DTW)技术实现语音识别。随着研究的逐步深入,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络(Artificial Neural Networks,ANN),混沌、分形等非线性理论研究和应用的日新月异,将这些理论应用于语音别成为可能。本文对现有的语音识别技术发展现状进行了分析,介绍了语音识别的基本理论,包括语音信号的预处理、计算听觉场景分析(Computational Auditory SceneAnalysis,CASA)和特征参数提取。根据计算听觉场景分析的基本原理,针对本文设计所应用的场合,改进了计算听觉场景的结构,优化了其算法,并详细讨论了计算听觉场景在语音识别的前端应用,很好的分离了语音采集前端的混叠语音,提高了算法的抗噪声能力。文中还阐述了语音特征参数的提取算法,比较了线性预测编码倒谱(LinerPrediction Cepstrum Coefficient,LPCC)系数和Mel频率倒谱系数(MelFrequency Cepstrum Coefficient,MFCC)的优缺点,详细论述了Mel频率倒谱系数的提取方法和运算步骤。文中还研究了隐马尔可夫模型和自组织神经网络(Self Organizing Neural Networks,SONN)的原理及其在语音识别中的应用,详细讲述了HMM的原理与模型参数,分析了每个参数的提取方法,讨论解决了HMM的三个基本问题;讲述了人工神经网络的基本概念,BP网络和自组织神经网络的结构和算法,并且分析比较了它们的识别特性与应用特点,提出了基于CDHMM和SONN的混合模型原理及算法,并加入到SONN分类器进行语音识别。本文设计了语音识别系统的软硬件结构,并在ARM—Linux环境下对基于CASA和HMM-ANN模型的算法进行了实验,测试了在各种场合下的语音识别率。分析测试结果表明,与以前的HMM模型方法相比,改进后的基于CASA的HMM-ANN模型提高了语音识别系统的准确率和识别系统的抗噪声能力,提升了系统的鲁棒性和自适应性,充分体现出改进模型的性能,证明了该系统的可行性和有效性,最后指出了需要进一步改进的问题和本课题未来的研究方向。
其他文献
进化算法是当前求解多目标优化问题的一种主要方法,因此多目标进化算法(MOEA)成为了计算智能领域的重要研究课题。MOEA主要由变种算子(包括配对选择、重组和变异)和环境选择
柔性机械臂系统是高度复杂、高度非线性、非最小相位系统,且具有诸多的不确定性,因此,柔性机械臂末端轨迹跟踪问题有很大难度,再加上庞大的计算量和设备成本,成为了很多理论
随着多媒体技术和模式识别,人工智能技术的日益成熟,企业生产和物流管理的自动化和智能化程度不断提高,如何利用多媒体处理技术提供远程生产监控和智能物流管理已成为国内外研
在电力现代化建设中,提高发电机发电效率是其中重要的一环,氢气作为导热性冷却介质广泛的应用于发电设备,作为冷却剂,它可以有效地提高其发电效率,但它又是一种易燃易爆气体,
本课题选取青岛光华玻璃厂马蹄焰玻璃窑炉作为研究对象,设计了基于FF现场总线技术的自动控制系统。重点针对玻璃窑炉温度参数滞后大,反应慢的特点,研究开发了基于OPC(OLE for
种子处理是促进农业生产的一项重要措施,经过种子处理可以提高种子发芽能力,改善作物品质,缩短作物生育期,提高作物总产量。过去常用化学溶液处理种子,起到灭菌杀虫、提高发
说话人识别是指通过语音来识别说话人的身份。作为一种基于生物特征信息的身份识别方法,它在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动
电路印刷板PCB板作为现代电子设备的重要组成部分,其质量直接影响到产品的性能。对电路板进行在线检测和及时差错纠正,可以避免废品、改善质量、降低损耗。近年来随着PCB生产
汽轮机组的诊断一直是故障诊断技术应用的一个重要方面。在众多常见故障的发生率中,振动故障占了总数的95%以上。基于这种考虑才选定了汽轮机故障诊断技术研究一题,尤其是探
目前有线电视的主要网络为HFC(Hybrid Fiber-Coax)光纤同轴电缆混合网。为提升业务能力,充分利用现有庞大的HFC基础网络来拓展双向传输业务(诸如:宽带、数字电视、视频点播),本