汉语语音识别应用系统中的若干关键技术研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:pengwei000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以语音作为人机交互手段所带来的巨大便利和深远影响吸引着人们不断探索计算机语音合成和语音识别技术,对于汉语来说,鼠标键盘的人机方式有先天的劣势,所以汉语的语音识别更具有现实意义。本文提出了一个完整的汉语识别系统方案,在介绍系统不同模块的原理同时,分析了典型做法的性能,并以此提出了一系列的改进方法。文章重点研究了以下三个领域:端点检测算法对孤立词和连接词的识别性能有很大影响,本文在经典双门限端点检测技术的基础上,采用设定上下界的门限值自适应方法,并针对汉语语音,提出了基于“字”的端点检测技术,避免了语音孤立词命令因不恰当的端点检测而造成的缺字或者前后有杂音时带来的问题。实际使用中造成孤立词识别性能不良的主要原因之一是词表外(OOV)音频的存在:使用者或者环境意外发出的声音可能误认为是语音命令而识别。本文比较了多种OOV拒识算法,最后采用了时间归一化,考虑了模板自匹配性能的神经网络方法。对于非特定人识别的另一问题是非特定人模板库的建立。本文介绍了常用的模板库建立方式,并提出了一种优化模板库的方法,在不影响非特定人识别性能的前提下,大幅压缩了模板库的容量。本文最后介绍了使用剑桥大学HTK开发工具建立的孤立词识别应用:书店导购演示系统,和关键词检出应用:声控电子宠物。这两个系统使用前几章中的改进技术,调用Window的API函数从麦克风采集语音信号,使用Mel刻度倒谱系数MFCC为语音特征,模板匹配采用HTK提供的HMM模型,最后对识别结果做OOV判决,如果判决认为识别结果不是合法词汇,则拒绝响应。模板库的建立采用自行录制的孤立词语音库,使用模板库优化方法确定最终存放于模板库的模板。
其他文献
教师和学生的交流和沟通的效果影响着学生的学习质量和学习效率。在初中数学的教学课堂之上,教师扮演着一个十分重要的角色。初中数学教师不仅要有着满腹的知识储备,而且在他们
近十多年来,低维纳米结构的制备越来越引起了人们的关注.这是因为当材料在某个维度上的尺寸小到量子效应起主导作用时,将会展现出一些奇特的物理和化学特性.例如,非磁性的块
资源受限项目调度问题(Resource-Constrained Project Scheduling Problems,RCPSPs)是一类重要的调度问题,它要求在满足项目优先关系约束和资源约束的条件下,安排所有任务的开始时
近些年来,人造金属周期性结构在微波频段表现出的电磁带隙(EBG)特性,使得微波毫米波波段金属EBG器件得到越来越深入的研究。金属EBG微波器件具有损耗小,散热好的特点,尤其适
随着现代社会信息技术的发展,对安全性的要求越来越高。虹膜作为生物测定学特征用于身份识别具有得天独厚的优势,与其它几种生物识别技术相比,具有非常高的综合优势。目前国
随着当代嵌入式技术的飞速发展,嵌入式系统的成本低、体积小、稳定性好等众多优点使其的应用领域越来越广,本文将嵌入式系统应用到ARINC429总线测控领域,提出了一种功能全面
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
云南是全球生物多样性最丰富的地区、世界稻种最大的遗传多样性中心之一及功能稻米的富集区。功能稻米是日常饮食中用量最大和饮食规律性最强的食品,挖掘利用云南稻核心种质的
目前中国市场上有两个技术热点,一个是第三代通信系统(3G),另一个是数字电视。它们的技术体系日益成熟,正逐步走向市场化,产生了巨大的经济效益和社会效益。在模拟电视向数字
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊