一种基于HMM和RBF网络混合的语音识别算法研究

来源 :兰州理工大学 | 被引量 : 8次 | 上传用户:fangwd_clily
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是一门涉及声学、语音学、语言学、计算机科学、信号处理、人工智能等诸多学科的综合性技术,目前已经被应用在工业、军事以及医疗等部门的指挥、产品检验以及数据录入等人机有声通信领域。长期以来一直是人们研究的热点,但是现有准确率较高的语音识别系统仍存在着耗时、成本高、使用起来不方便等缺点。这些缺点都影响着语音识别的速度、硬件实现和推广应用。本文首先在隐马尔可夫(HMM)模型和径向基神经网络(RBF)具体内容的基础上,分析了它们各自的优点和不足之处,提出了基于CDHMM和RBF的汉语数字混合语音识别模型和基于RBF的状态估计快速训练算法。该模型在训练阶段用多个简单RBF组成的神经网络组计算HMM状态的观测概率,识别阶段用每个HMM的平均值矢量序列与待识语音进行线性粗匹配,选择距离最小的HMM对待识语音规整,然后用神经网络通过不同的测度,对HMM模型输出的不易区分识别结果进行精识别。为了检验算法的有效性,在MATLAB6.5环境下对HMMNN混合模型进行了仿真计算,分析了汉语数字混合语音识别模型不同特征参数、训练样本数目、背景噪声对识别结果的影响,并分别应用CDHMM模型和HMMNN混合模型对非特定人进行汉语孤立数字和连续数字语音识别实验。结果表明,本文提出的模型和算法是有效的,与CDHMM模型方法相比,混合模型显示出其快速学习的能力,有较高的识别率和较大的应用优势,可以实现语音识别速度和效率的双赢。
其他文献
目的:探讨老年抑郁症患者认知水平的改变及其与疾病转归之间的关系.方法:以2010年1月~2011年12月就诊于青岛市精神卫生中心的老年抑郁症患者为研究组(SD组,n=64),均符合《中国
通过现代媒体手段实现党政与民众之间的良性互动,把党和政府的命运与民众的命运紧密联系在一起,杭州市近年来通过尊重媒体运行规律,培育媒体发展,并认识和把握新媒体的特性,
由于我国经济的持续快速发展,对外贸易越来越频繁,给港口物流业带来了前所未有的机遇和挑战。这就需要港口提高效率,加快发展,这就对港口的自动化作业提出了很高的要求。港口机器
能源是人们日常生活的最重要资源之一,也是国民经济生产中基本的投入要素之一。目前,中国的能源生产主要以不可再生能源生产为主,而这种格局在未来一段时间内很难被打破。为了实
期刊
为了充分显现党员在先进性教育活动中的作用,孝感市孝南区直学校广泛开展了以实施“师表工程”为抓手的“五评”活动,即学生评教师、教师评校长(校委会一班人)、家长评学校、
近年来发展起来的基于知识且不依赖于模型的智能控制技术为解决系统的非线性、滞后和时变等问题提供了新的思路。模糊控制技术是智能控制研究中最活跃的领域,也是未来研究与应
宣传工作是先进性教育活动极其重要的组成部分。在先进性教育活动中,宣传工作做得是否广泛、深入、扎实,直接关系到整个活动能否真正取得实效和成为“群众满意工程”这个全局
预测控制被认为是工业过程最有前途的优化控制算法,对于复杂控制问题,预测控制技术能提供比PID控制技术更优良的控制性能,已被许多大公司嵌入到控制系统软件中,在一些大型的过程
随着信息技术的迅猛发展,图像作为信息载体的作用日益增大,其包含的信息量巨大,但同时也给人工处理带来困难。在各种图像分析任务中,人们感兴趣的内容通常只占图像的很小一部