语音识别系统实时优化方法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:killpl12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要的目标是在语音识别率不降低或者降低很小的前提下,加快语音识别的速度。具体开展了语音识别算法级和代码级别的优化工作。 在算法级优化方面,主要针对计算量最大的两个模块进行了优化:在声学模型得分计算阶段,尝试进行了帧降采样、上下文无关音子模型选择、基于矢量、子矢量量化的高斯选择等,对高斯混合模型分层优化;对于搜索阶段,在已有的语言模型LookAhead的基础上又尝试了音子LookAhead方法剪裁搜索空间。实验结果表明上述优化算法是有效的。 在代码级优化方面,首先使用了Intel的VTune性能分析工具,找到解码程序计算量最大的代码段,对其进行了优化:一方面,对高斯计算中均值、方差的存储进行了优化;另一方面,利用单指令多数据中的数据流扩展指令集SSE(StreamingSIMDExtention)对高颠计算循环体内的代码进行优化,加快解码的速度。 最后,优化系统在识别率降低5%以内的情况下,从4.3倍实时达到了1.7倍实时。
其他文献
尖镰孢致病菌是一个世界性的土传植物病害,这类致病菌能引起大约80多种植物的枯萎疾病,造成极大的农作物和观赏植物的损失.随着枯萎病化学防治的逐渐淘汰,寻找生物防治制剂,
军旅画家韩坤平,1962年生于山东聊城,毕业于解放军艺术学院,结业于科里瓦诺斯油画高研班,中国美术家协会会员、中国版画家协会会员、济南军区前卫文工团专业美术、山东画院院
思维导图是一种简单、高效的信息加工和呈现的方法,思维导图工具的开发和应用大大推进了思维导图的推广。现今,思维导图已经被广泛应用在个人、家庭、教学和企业等领域,尤其在教
目前,仪表的智能化、网络化已成为全球仪表发展的趋势。功能集中的增强型仪表逐步取代了功能较单一的模拟和数字仪表,以集中取代离散,把强大的微机处理功能应用到工业过程控制行
本文通过对荣华二采区10
期刊
TDMoIP技术能在IP网络上透明的传输数字比特序列独立信号,提供保证服务质量的TDM业务。通过使用该技术既可保留过去对TDM的投资又可利用IP网络的优势,降低了维护和使用成本,提高
声呐目标识别是水声对抗三大技术之一。被动声呐通过接收舰船辐射噪声,提取有效的特征,进行目标识别,具有安全、隐蔽的优点,在军事斗争日益复杂的今天,具有重大的战略需求和实用价
由于传统微生物技术的不足,局限了我们对垃圾堆填区中古细菌和真细菌多样性的研究。本文中采用不依赖于纯培养的分子生物学方法对深圳过桥窝垃圾露天堆放区渗滤液中的古细菌和
Halomonasmeridiana(盐单胞菌属)是James等(1990)首次从南极盐湖(盐度从4‰~174‰)中分离出的一株耐盐的盐单胞菌属新种。此属的细菌多生活于极端环境中,既往有关此属细菌的工
本论文研究了声学模型的变码本数子空间聚类、声学模型的定点化、声学模型中不同声学基元的复合以及语音信号的实时盲分离.这四个部分的研究目标是减小语音识别的资源占用或