声学模型的研究及在关键词识别系统中的应用

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:zhuguangxinli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术近年来高速发展,有着广阔的应用前景。让机器听懂人说话,甚至实现与人的交流是人类一直以来梦寐以求的愿望。现在语音识别技术的研究工作主要集中在大词汇量连续语音识别的范畴,但是对汉语而言,在提高系统识别率和系统鲁棒性方面都有大量的工作要做,这仍然是个任重而道远的任务。本文首先介绍了在语音识别中广泛应用的隐马尔可夫模型的基本理论。同时为了将该模型引入到语音识别的实际应用,讨论了它的三个主要问题和主要算法。接着介绍了本文中普通话数字声学模型所使用的语料库和训练环境,分析了普通话数字的声学特点并研究了其训练方法。更详细分析了普通话数字的识别难点和声学模型缺陷。针对连续数字识别的难点从标注和模型自身两个方面提出相应的模型优化办法来对其改进。获得大量的实验数据后,对实验结果进行了总结和分析,肯定了模型训练优化方法的有效性。随后对汉语普通话的声学特点进行了详细介绍,分析了音素,音节,声韵母等不同基本单位作为识别基元的优劣,并对关键词识别系统进行了介绍,对于两种不同结构的关键词系统进行了比较分析。为了改善关键词系统的拒识性能,训练出关键词反词模型,并获得了竞争词似然度测试结果,对两者进行了比较和分析。最后对本篇论文所做的工作进行了总结和展望。
其他文献
Linux是多用户、多任务的操作系统,它不仅继承了Unix操作系统功能强大、性能稳定的特点,还在许多方面超越了Unix。由于Linux系统的诸多特性,使其在服务器领域中的应用越来越普遍
软交换是NGN(下一代网络)的核心技术,随着软交换技术的不断发展和完善,软交换呼叫服务器的质量是人们共同关注的焦点。作为软件测试中的一个重要组成部分,集成测试在软交换系
FBA是一种既支持实时业务又支持非实时业务,并且不需要复杂的流量管理机制,它以电路交换方式为基础,通过动态的分配资源,能很好的支持多种类型业务的传输需求,可以成为我国的综合
目的:通过对小样本的随机对照试验探讨肾康注射液对重症急性胰腺炎(SAP)合并急性肾损伤(AKI)患者的治疗效果及对治疗过程中S100A12及尿液中N-乙酰-氨基葡萄糖苷酶(NAG)表达变
人体动作识别和物体显著性检测均是近年来计算机视觉领域的热点研究内容。其中,人体动作识别是视频检索、视频监控以及智能人机交互等应用的关键技术,具有广阔的应用前景。但由
随着LTE技术的成熟,与LTE系统具有良好兼容性的LTE-A系统凭借具有更高的峰值速率、更低的传输时延等优势,受到了学者和运营商的广泛关注。目前,用户数量在不断地增多、业务需
目的:研究分析自发气胸手术使用腋下小切口操作的临床效果和应用价值.方法:30例自发气胸患者,随机分成对照组和治疗组,各15例.治疗组患者接受传统腋下小切口手术治疗,对照组
P2P的研究热度呈逐年增长的趋势,作为一种完全分布的计算模型,可以脱离中央服务器实现对等节点间的直接通信,从而充分利用每个网络节点自身的资源,实现整个网络计算资源的充分利
基于内容的图像检索是根据描述图像视觉内容的特征向量进行相似性检索,其中图像视觉内容的提取可以是通用的,也可以是基于特定领域的。基于特定领域的图像检索技术可以充分利
随着社会的日益发展,在当前的信息时代对通信技术的要求是通信容量大、传输速率高。星间光通信正是以其传输码率高、功耗低、抗干扰能力强等一系列优点适应这种需求而发展起