小词汇量连续语音识别系统的研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wori10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代信息科学的迅猛发展,智能化工具进入人们的生活,致使人们渴望人与机器的交互,甚至期盼人与机器的对话能达到人与人之间交流的那种自然的水平。在种种思潮的触动下,对人机交互的研究近几年来趋于活跃。实现对语音的识别是人机交互研究的核心之一,也是它的一个重要研究课题。作为一项具有广泛社会效益和经济效益的现代信息技术、语音识别技术虽然己经取得了很大的成就,但是面临实用化时还存在一系列的问题。要实现性能优良、实用化的语音识别系统,人们仍需要不断对语音识别的理论、算法进行研究,解决和完善语音识别中所存在的各种问题。另外,随着各种科学理论的不断发展和深入,一些新技术、新理论也不断出现,这些都为语音识别的研究奠定了基础。本文根据近期国内外对语音识别技术的集中研究方向,以及目前语音识别技术在实用性方面存在的一些问题,对语音识别技术在声学模型的改进以及语言学知识的引入方面进行了学习和研究。首先将代数算法和BP算法应用于孤立词的语音识别系统中,通过实验验证了代数神经网络的优越性。在此基础上,考虑到隐马尔可夫模型自身的一些缺陷和人工神经网络具有可以与隐马尔可夫模型互补的一些特点,用代数神经网络代替高斯混合器来计算隐马尔可夫模型的观测概率,以此提出了一种代数神经网络和HMM模型的混合模型。之后,文中对基于混合模型的连续语音识别系统进行了设计,将语言学知识引入到模型中,选取三音素作为基本声学单元,为训练语音数据中用到的所有三音素建立了隐马尔可夫模型,并采用了基于决策树的状态共享策略,以保证对声学模型参数的充分估计,最后将训练好的各个三音素模型根据本文中提出的混合模型的原理,构建了相应的代数神经网络,并用相应训练数据对其训练,最终实现了一个基于混合模型的连续语音识别系统。最后,本文在HTK平台的基础上,结合java语言实现了基于混合模型的连续语音识别系统。结果证明将混合模型结合语言学知识应用于语音识别系统是切实可行的。通过实验数据的对比可得知,依据此混合模型构建的非特定人连续语音识别系统克服了HMM模型自身的一些缺陷,识别率优于基于HMM模型构建的识别系统。
其他文献
随着当今时代科技水平的不断发展,信息化已经越来越多的应用于众多行业和领域,现阶段我国企业的财务会计工作中,会计信息化已经成为一个重要的发展趋势。会计信息化对传统的
美国盐业流通是市场化流通模式,呈现出寡头垄断的经营格局,采取产销合一、以销定产的产销模式,实施政府监管、行业协调、企业自律的运行机制,以直销、非直销、第三方物流相结
勘察设计企业在经历数值计算、CAD应用、软件集成三个不平凡的阶段之后,又在向新的领域——信息化建设协同设计方向迈进。由于软件开发商与设计企业在协同设计这一理念的认知
类沸石咪唑骨架材料(ZIFs)是金属有机骨架材料(MOFs)的一种。它是由Zn或Co原子与有机配体形成的的金属有机骨架材料。ZIF-8是类沸石咪唑骨架材料中的一类,它是由金属原子Zn与
目的探讨自动痔疮套扎术与传统痔疮手术治疗痔疮的方法及临床疗效比较。方法于2016年1月~2017年1月在我院进行手术治疗的痔疮患者中选取60例,随机分组,其中观察组和对照组患
目前,我国大多数污水处理厂存在碳源不足的问题,导致出水氮、磷不能同时达标;污泥通过微氧水解酸化产生短链的挥发性脂肪酸,可以作为生物脱氮除磷工艺的碳源,同时实现污泥的
我国大中型企业陆续设立财务总监职位,在职位越来越耀眼的同时,其面临着民事责任和刑事责任双重法律风险亟需引起关注。本文分析了财务总监法律风险产生的原因,并提出完善财
<正>随着基础教育课程改革的不断深入,人们越来越注意到中小学生综合核心素养的培养和提升.2014年,教育部颁布了《关于全面深化课程改革落实立德树人根本任务的意见》;2016年
基于渝西经济区多目标区域地球化学调查资料,采用正态和对数正态法,获得了土壤54种元素(指标)的地球化学基准值和背景值,并研究其分布特征;同时分析了岩石风化成土过程元素的
近年来,我国对珍贵硬木特别是红木类木材需求旺盛,而我国是一个木材资源稀缺的国家,通过进口来满足国内消费和加工业对木材日益增长的需求,已成为我国木材市场经济发展的重要