基于稀疏编码的藏语语音识别研究

来源 :青海师范大学 | 被引量 : 3次 | 上传用户:lxm1230520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相对于汉语和英语等大语种语音识别,藏语语音识别研究始于2005年,起步较晚,且不同语种间存在差异,采用新技术以提升藏语语音识别系统性能,将成为藏语语音识别研究领域亟待解决的问题。针对藏语单音节识别系统,本研究主要进行了以下工作:1.特征提取。以梅尔频率倒谱系数作为输入的卷积神经网络可同时获取时序信息和空间位置信息。实验中提取了两类特征,即静态与动态的梅尔频率倒谱系数。2.稀疏编码。为了尽可能地消除特征间的相关性,减少与分类无关的信息,使用稀疏编码获取两种梅尔频率倒谱系数的稀疏表示。稀疏编码采用K-SVD算法。3.分类器设计。以多维矩阵作为输入的卷积神经网络可保持输入数据维数不变。为了捕捉空间位置特征,选择卷积神经网络作为分类器。4.基于稀疏编码的藏语语音识别系统。该系统将稀疏表示后的梅尔频率倒谱系数输入卷积神经网络用以识别藏语单音节语音。本研究将稀疏编码与卷积神经网络两种技术相结合,以改善语音识别系统性能。通过实验得出以下结论:1.相对于深度神经网络,卷积神经网络更适合处理高维数据;2.动态梅尔频率倒谱系数和稀疏编码可提升藏语语音识别系统性能;3.本系统可用于藏语语音识别任务。本研究主要贡献是将稀疏编码与卷积神经网络相结合构成基于稀疏编码的藏语语音识别系统以进行藏语语音识别。
其他文献
高档茶即名优茶,价格持续上扬。大众消费倾向于经济实惠、具有“汤清叶绿”的绿茶,市场占有空间大,感官掌握绿茶初制工艺要领.对提高绿茶的质量和效益至关重要。绿茶初制工艺包括
摘要从德化县水稻的生产现状,分析了影响水稻生长发育的光热水资源状况及其近40年来的变化规律,从干旱、涝灾和寒灾灾害对水稻生产影响的频率、深度等方面综合阐述了水稻生产的气候背景,并提出了气象灾害的防御措施,为水稻生产趋利避害、提高其产量和质量提供参考。  关键词气象灾害;水稻种植;影响;防御措施  中图分类号S42文献标识码A文章编号 1007-5739(2009)21-0241-01    德化县
船舶是世界能源的重要搬运工,航运市场价值实现的载体,同时也是重度能源依赖型机械,船舶节能已经涉及到船舶制造过程的每一个环节。但是,面对当今低迷的海运市场,新造船数量在逐年递减,对现代船舶的减阻节能研究成为一大热点。目前有众多减阻方法应用在船舶上,比如肋条减阻法、气幕减阻法、气泡减阻法和高分子聚合物添加剂减阻法等等,其中技术难度不一,有的改变船舶航行状态,有的在船体增加物质或者附体结构,最终达到减阻
肺癌无论是在中国还是在世界,都是癌症的第一大杀手。当前CT引导下的经皮胸腔穿刺活检手术是一种重要的诊断方式,该手术目前主要依靠医生徒手进行下针操作,之后再由医学影像
UML是一种面向对象方法建模的标准语言,在系统开发中有广泛的应用。本文根据实验室管理系统的软件开发需求,描述了系统功能需求分析建模的过程。
目的:基于ApoE-/-小鼠建立的非酒精性脂肪肝模型,观察石榴花多酚(pomegranate flower polyphenols,PFP)对ApoE-/-小鼠肝脏功能的影响,进一步探讨石榴花多酚对血脂和肝功能的
脆弱拟杆菌(Bacteroides fragilis,B.f)是人和动物肠道中的共生菌,近来许多研究发现其在促进免疫系统成熟、抑制炎症反应及改善肠道菌群结构方面发挥重要作用,也因如此,脆弱
目的 探讨临床实践与国家职业护士资格考试进行有机结合在临床带教中的应用效果.方法 依据国家护士资格考试所涉及的知识内容,结合临床实践,从多种方面对护生进行临床带教.结
4月11日,高桥湾水利枢纽工程水电站项目举行签约仪式。霍山县委常委、纪委书记江晨光,县委常委、副县长许海东出席签约仪式。据悉,高桥湾水利枢纽工程水电站建设工程由浙江省台
期刊