基于ARM-Linux的抗噪声语音识别技术研究

来源 :广东工业大学 | 被引量 : 2次 | 上传用户：popwoool20

【摘要】

：

语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。到目前为止,语音识别研究大

【作者】

：

王忠文

【机构】

：

广东工业大学

【出处】

：

广东工业大学

【发表日期】

：

2008年01期

【关键词】

：

汉语语音识别隐马尔可夫模型人工神经网络特征提取自组织模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。到目前为止,语音识别研究大部分以线性系统理论为基础,主要应用隐马尔可夫模型(Hidden Markov Model,HMM)与动态时间规整(Dynamic Time Warping,DTW)技术实现语音识别。随着研究的逐步深入,基于线性系统理论的语音识别方法的局限性越来越凸显。近年来,随着人工神经网络(Artificial Neural Networks,ANN),混沌、分形等非线性理论研究和应用的日新月异,将这些理论应用于语音别成为可能。本文对现有的语音识别技术发展现状进行了分析,介绍了语音识别的基本理论,包括语音信号的预处理、计算听觉场景分析(Computational Auditory SceneAnalysis,CASA)和特征参数提取。根据计算听觉场景分析的基本原理,针对本文设计所应用的场合,改进了计算听觉场景的结构,优化了其算法,并详细讨论了计算听觉场景在语音识别的前端应用,很好的分离了语音采集前端的混叠语音,提高了算法的抗噪声能力。文中还阐述了语音特征参数的提取算法,比较了线性预测编码倒谱(LinerPrediction Cepstrum Coefficient,LPCC)系数和Mel频率倒谱系数(MelFrequency Cepstrum Coefficient,MFCC)的优缺点,详细论述了Mel频率倒谱系数的提取方法和运算步骤。文中还研究了隐马尔可夫模型和自组织神经网络(Self Organizing Neural Networks,SONN)的原理及其在语音识别中的应用,详细讲述了HMM的原理与模型参数,分析了每个参数的提取方法,讨论解决了HMM的三个基本问题;讲述了人工神经网络的基本概念,BP网络和自组织神经网络的结构和算法,并且分析比较了它们的识别特性与应用特点,提出了基于CDHMM和SONN的混合模型原理及算法,并加入到SONN分类器进行语音识别。本文设计了语音识别系统的软硬件结构,并在ARM—Linux环境下对基于CASA和HMM-ANN模型的算法进行了实验,测试了在各种场合下的语音识别率。分析测试结果表明,与以前的HMM模型方法相比,改进后的基于CASA的HMM-ANN模型提高了语音识别系统的准确率和识别系统的抗噪声能力,提升了系统的鲁棒性和自适应性,充分体现出改进模型的性能,证明了该系统的可行性和有效性,最后指出了需要进一步改进的问题和本课题未来的研究方向。

其他文献

基于近邻传播的多目标进化算法及其应用

进化算法是当前求解多目标优化问题的一种主要方法,因此多目标进化算法(MOEA)成为了计算智能领域的重要研究课题。MOEA主要由变种算子(包括配对选择、重组和变异)和环境选择

学位

进化算法多目标优化近邻传播聚类导弹瞄准点优化

基于函数逼近的柔性机械臂变轨迹迭代学习控制

柔性机械臂系统是高度复杂、高度非线性、非最小相位系统,且具有诸多的不确定性,因此,柔性机械臂末端轨迹跟踪问题有很大难度,再加上庞大的计算量和设备成本,成为了很多理论

学位

柔性机械臂期望轨迹可变迭代学习控制末端跟踪函数逼近振动抑制

企业智能视频监控系统的设计与实现

随着多媒体技术和模式识别,人工智能技术的日益成熟，企业生产和物流管理的自动化和智能化程度不断提高，如何利用多媒体处理技术提供远程生产监控和智能物流管理已成为国内外研

学位

模式识别人工智能视频监控系统物流管理字符识别

基于ARM和CPLD的氢气参数实时监测系统

在电力现代化建设中,提高发电机发电效率是其中重要的一环,氢气作为导热性冷却介质广泛的应用于发电设备,作为冷却剂,它可以有效地提高其发电效率,但它又是一种易燃易爆气体,

学位

ARMCPLDSD卡GSM氢气

应用FF现场总线实现玻璃窑炉先进控制的研究

本课题选取青岛光华玻璃厂马蹄焰玻璃窑炉作为研究对象,设计了基于FF现场总线技术的自动控制系统。重点针对玻璃窑炉温度参数滞后大,反应慢的特点,研究开发了基于OPC(OLE for

学位

FF现场总线马蹄焰玻璃窑炉OPC技术预测函数控制混合编程

旋转磁场和高强度脉冲磁场对小麦种子影响的研究

种子处理是促进农业生产的一项重要措施,经过种子处理可以提高种子发芽能力,改善作物品质,缩短作物生育期,提高作物总产量。过去常用化学溶液处理种子,起到灭菌杀虫、提高发

学位

旋转磁场高强度脉冲磁场小麦种子萌发幼苗生长

基于蚁群算法的说话人识别系统的研究

说话人识别是指通过语音来识别说话人的身份。作为一种基于生物特征信息的身份识别方法,它在电子商务、消费、银行等远程客户服务的身份认证、军事安全领域的说话人身份自动

学位

说话人识别特征提取美尔倒谱系数混合高斯模型聚类蚁群算法

印刷电路板光板和贴片组件检测系统的研究

电路印刷板PCB板作为现代电子设备的重要组成部分,其质量直接影响到产品的性能。对电路板进行在线检测和及时差错纠正,可以避免废品、改善质量、降低损耗。近年来随着PCB生产

学位

PCB图像处理图像识别DSPVBMATLAB

基于小波分析和神经网络的汽轮机故障诊断研究

汽轮机组的诊断一直是故障诊断技术应用的一个重要方面。在众多常见故障的发生率中,振动故障占了总数的95%以上。基于这种考虑才选定了汽轮机故障诊断技术研究一题,尤其是探

学位

汽轮机小波分析神经网络免疫遗传算法故障诊断

基于同轴电缆的宽带接入系统的研发—802.11在同轴电缆上的应用

目前有线电视的主要网络为HFC(Hybrid Fiber-Coax)光纤同轴电缆混合网。为提升业务能力，充分利用现有庞大的HFC基础网络来拓展双向传输业务(诸如：宽带、数字电视、视频点播)，本

学位

有线电视网络宽带接入系统同轴电缆硬件设计软件开发混频电路频率合成器双向混频器

基于ARM-Linux的抗噪声语音识别技术研究

其他学术论文