场景特定词的非特定人语音识别

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:jackyzero123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能的飞速发展,促使了自动语音识别的理论研究及应用领域的进一步拓展,人类与机器的语音交流已经成为当前的发展潮流之一。例如在高速公路口收费站的场景下,工作人员与过往司机交流时是否使用特定礼貌用语和使用频数就是管理员评估他们工作的重要依据之一。本论文主要研究特定人及非特定人的孤立词语音识别算法,并针对高速公路口收费站,选定收费员与过往司机交流的20个礼貌用语作为孤立词表,完成一套非特定人语音识别系统。主要研究工作如下:(1)针对特定人的孤立词语音识别。选择语料库中800条语音文件,对每位发音人进行基于动态时间弯折(Dynamic Time Warping,DTW)的孤立词语音识别的实验,通过三种改进方法:当端点检测时,多设置几个门限;当梅尔频率倒谱系数(Mel Frequency Coding Coefficient,MFCC)作为特征参数提取时,加入一阶差分的动态参数特征;当模板匹配时,使用基于动态规划的DTW算法,如此使得系统的识别正确率达94.6%。(2)针对非特定人的孤立词语音识别。将语料库的2600条语音文件划分成五组不同的训练集和测试集,对训练语音依次进行预加重、分帧加汉明窗及端点检测的预处理,完成24维MFCC特征参数提取,采用Baum-Welch算法对特征参数进行训练,得到20个特定词的隐马尔可夫模型(Hidden Markov Model,HMM)参考模板;然后,对测试语音完成预处理和特征参数提取后,对测试语音特征参数与HMM参考模板进行匹配,得到识别结果。实验验证,在本语料库上基于HMM的孤立词语音识别系统识别正确率达92.8%。(3)搭建了一套高速公路收费站场景下的非特定人语音识别系统。完成人机交互界面设计、语音采集、离线识别语料库和本地语音,以及在线实时识别4秒录音的工作。
其他文献
目的提高以急性肾损伤为表现的急性淋巴细胞白血病的认识。方法回顾分析两例急性白血病合并有急性肾损伤的病例并复习文献。结果经化疗及CRRT等支持治疗后肾功能逐渐恢复,急
<正>在庐山松树路的西端,有一片奇形怪状的岩石,其中一块巨石上写着"虎守松门"4个大字。这4个正楷大字遒劲有力,如果不看边款,谁都不会相信它出自20世纪30年代一位70多岁的老
油菜素内酯(Brassinosteroids,BRs)是一类广泛存在于植物体内的甾醇类激素,它参与调节植物生长发育的多个过程,如细胞分裂和细胞伸长、光形态建成、开花、育性及衰老等。BRI1
苏云金杆菌或转基因植物产生的苏云金杆菌杀虫晶体蛋白毒素对靶标害虫毒杀能力很强,是一种非常重要的环境友好的生物农药,为植物提供了良好的保护作用。但是由于其广泛使用,
工业上蓝光芯片结合黄色荧光粉方式出射的白光色温偏高,显色指数较低,因此紫外芯片与RGB荧光粉复合结构得以推广,但其较低的发光效率一直困扰着LED照明行业。为了解决这一问题,本文从RGB荧光膜结构设计角度出发,通过对RGB荧光膜进行模拟仿真并结合实验验证的方法,设计对比了四种具有不同点阵排布结构的荧光膜的光学性能,并通过研究荧光像素点的尺寸对封装LED出光均匀性的影响,确定了最佳的结构方案。通过实验
随着越来越多的传统行业向互联网转型,垂直领域信息化程度不断提高,数据整合,信息多元化和兴趣垂直化使得通用搜索引擎已经不能满足垂直领域用户的需求。这些用户迫切需要一
随着计算机视觉的发展,生活中对目标跟踪的要求越来越高,所以对目标跟踪算法的要求也越来越高。已有的目标跟踪算法已经可以解决大部分简单情况下的目标跟踪,但是仍有许多情
目的:通过观察比较赖氏通元针法和口服耳聋左慈丸为处方基础的中药对肾精亏损型神经性耳鸣患者在耳鸣程度和相关临床症状改善程度,证实赖氏通元针法可改善患者耳鸣程度及改善
在有花植物的生命周期中,孢子体世代占据主导地位,胚胎与胚乳作为孢子体发育的起点,对植物的生长和发育至关重要。线粒体作为真核生物中一个古老的细胞器,必然在早期孢子体发
2008年为了应对国际金融危机,中国政府采取了加快铁路、公路及机场等基础设施建设的举措。另外随着北京奥运会、上海世博会、广州亚运会及深圳大运会的成功举行,各类大型场馆