噪声环境下汉语连续语音识别技术研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:wangfeiqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别已经有了半个多世纪的研究历史,取得了很大的进展。当前的语音识别系统在纯净语音环境中已经获得了非常高的识别精度,但在现实应用中,无处不在的噪声使得系统的识别性能大幅度降低,抗噪声问题是语音识别系统实用化的关键问题之一。本文主要研究加性噪声环境下的汉语连续语音识别技术。首先介绍了语音识别的基本原理、语音识别系统的组成及其关键技术,随后介绍了噪声的分类和各种抗噪声技术,在此基础上本文的主要工作有:1)在个人电脑平台上实现了一个中等词汇量、非特定人的汉语连续语音识别系统。系统采用带调音节作为识别基元,Mel频标倒谱系数作为特征参数、隐马尔可夫模型作为识别模型,并对其进行实验,分析系统的性能。2)在汉语连续语音识别中,准确检测出音节的始点和终点是很重要的一步。现有的汉语连续语音端点检测方法在纯净语音环境下检测准确率很高,但在噪声环境下准确率大幅度降低。本文根据汉语连续语音的特点以及噪声的特性,提出了基于元音检测的汉语连续语音端点检测方法,有效提高了噪声环境下端点检测的准确率。3)语音识别系统处理的对象是特征参数,特征参数的抗噪性能对系统的抗噪性能影响很大。本文在分析传统Mel频标倒谱系数提取过程的基础上,结合小波包分析和滤波器加权分析,提出了一种新的特征参数提取方法。实验结果表明:改进后的特征参数比传统Mel频标倒谱系数具有更高的识别率和更好的抗噪性能。
其他文献
脱机手写数字识别是一个至今仍没有完美解决的问题,是一个很有挑战的问题。它有着广泛而重要的应用需求,如识别邮政编码、银行收据、税收票据、各种打印手写的数字等等,这吸
随着电信行业的飞速发展,除了电信的传统业务如宽带业务外,电信获得了3G牌照以后,企业获得了又一次的飞跃发展的机会,而带来这次发展的契机就是电信的移动业务,进入了3G时代,
随着计算机硬件的发展以及人工智能理论的不断完善,越来越多的简单重复性脑力劳动开始被计算机所取代,不仅极大地提高了效率,而且将人们从枯燥单调的脑力劳动中解放出来。针
随着无线传感器网络的应用越来越广泛,聚类算法被应用于此平台。聚类算法是数据挖掘和机器学习领域的一个重要的分支。无线传感器网络上的数据聚类可以应用于检测温度变化、
随着计算机信息技术和互联网的不断发展,以数字化技术为主的嵌入式产品正在广泛的应用于工业自动化、移动通讯、医疗仪器和家用电器等各个方面。嵌入式开发已经成为当今信息
第三方组件的广泛使用给软件开发带来很大方便的同时,其源代码不可知性也给软件工程带来一定的挑战。组件软件系统的某些功能是通过不同组件之间的相互协调、调用和通信来完
多核Cache中共享最后一级Cache(Last Level Cache,LLC)已经是一个研究热点。多核体系结构中LLC通常为共享L2 Cache,当被访问的数据块不在L2 Cache中时,将会发生L2缺失,CPU需
作为物联网的基础技术之一,无线传感器网络(简称WSN)成为当前研究热点。传感器节点的应用促成了网络与物理系统的连接,但由此带来更严重的敏感信息暴露问题,且传感网络的无线传
运动目标检测是视频跟踪和分析的基础,其中一个首要而关键的任务是从视频序列中确定运动目标。背景消减法是目前确定运动目标最常用的方法,其核心是将当前包含运动目标的视频
专家系统的成功使人们意识到知识在智能系统中的重要地位,而大量专家系统只能应用于特定领域和特定条件的现状,使研究人员转向为建立多个大规模常识知识系统而努力。  常识知