语音识别关键技术研究

被引量 : 30次 | 上传用户:juyuyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的迅速发展,语音识别的技术越来越成为国内外研究机构的焦点。人们致力于能使机器能够听懂人类的话语指令,并希望通过语音实现对机器的控制。语音识别的研究发展将在不远的将来极大地方便人们的生活。语音识别大致的流程包括:特征提取、声学模型训练、语音模型训练以及识别搜索算法。本文对语音识别整个过程,包括特征提取、模型训练及识别算法,进行了深入研究。根据汉语语音的发音特性,并综合考虑计算量等问题,选择汉语中的声韵母作为基本声学单元,同时选择使用半连续隐马尔科夫模型对声韵母进行建模。本文中选择的特征参数为Mel倒谱系数,本文深入分析了MFCC参数的提取过程,并提出了一种改进的MFCC提取算法,使得比传统MFCC提取算法的计算量减少了将近50%,极大地提高了特征提取的效率。Sphinx系统作为国际上发展成熟的语音识别系统。本文对其声学模型训练工具sphinxtrain内部实现及主要涉及算法进行深入研究,并且通过调整其中参数以适应汉语语音识别的要求。最终,本文基于CMU Sphinx构建并实现了汉语连续语音识别系统,达到了很好的识别效果,并在数字串语音识别中识别率更是达到了98%,同时也从码本数、状态数以及改进MFCC提取算法等方面对识别效果的影响进行了比较及分析。
其他文献
伺服作动系统是飞行控制系统的重要分系统之一。伺服作动系统控制性能和可靠性直接影响着飞行器的飞行安全。在统计数据中,飞行器绝大多数的飞行故障来自于伺服作动系统。典
简述了蛴螬的为害特性、年生活史、生物学特性,重点论述了近6年来国内在花生田蛴螬农业、物理、化学防治等方面的研究进展。
声学音响类产品在文化传媒、汽车制造、日常生活、休闲娱乐等领域中的运用越来越广泛,为了保证这些量大面广的音响类设备客观音质参数的准确性与可靠性,企业应该对这些产品进
近年来,我国的电子商务获得了飞速发展,尤其是BtoC形式的电子商务业务量增长速度惊人。电子商务作为一种依赖于互联网的虚拟交易,它在给人们带来诸多便利的同时也存在很多亟
氧化钒(VOx)薄膜在室温附近具有良好的热致半导体-金属相变性能,在光电开关、存储、太赫兹调制、智能窗等领域有广泛的应用。然而,不同的应用要求VOx薄膜的相变性能不同,尤其
目的:探讨腹内高压对肠道氧化还原状态的影响及其致肠黏膜屏障损伤机制,为临床研究提供实验依据.方法:健康成年新西兰兔21只,采用氮气气腹法制作腹内高压动物模型,按IAP大小
设计出适合特异性扩增引物和测序引物,采取焦磷酸测序技术对沙门氏菌invA毒力靶基因特异性序列分析,同时对焦磷酸测序反应条件进行优化,建立1种利用焦磷酸测序技术检测和鉴定
该文分析了云南省七个较少民族之一独龙族的整乡推进整族帮扶发展模式,并对发展过程中所形成的具有本地特色的、能够使经济和社会持续发展的经济模式理论进行概括和总结。主
采用石蜡切片法对青岛海滨地区的肾叶打碗花(Calystegia soldanella)营养器官解剖学特征进行了观察研究,结果显示:肾叶打碗花为典型的泌盐植物;叶片上下表皮分布有由多细胞组
针对多模制导中长焦距红外光学系统结构紧凑及宽温度范围热稳定性的要求,设计了一种中波红外折反光学系统。该系统根据其它模式制导的要求,采用固定焦距和口径的主镜,通过二