基于分割识别的蒙古语语音关键词检测方法的研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:ken_200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蒙古文属于黏着语,词根和后缀能够组合成近百万的蒙古文单词。现有的蒙古语大词汇量连续语音识别(LVCSR)系统的发音词典无法包含所有蒙古文单词。同时发音词典较大时,训练语料的稀疏将导致LVCSR系统的性能明显下降。为了解决LVCSR系统中大多数蒙古文单词的识别问题和蒙古语语音关键词检测系统中大量集外词的检测问题,结合蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法,并建立了对应的声学模型和语言模型。最后,将此方法应用到了蒙古语语音关键词检测系统中并在蒙古语语音语料上进行了测试。实验结果表明,基于分
其他文献
现有的人民币伪钞等打印信息的识别技术主要是对钞票上的安全线、水印、磁性油墨、荧光油墨等物理特性进行识别。随着伪造技术的发展,特别是随着HD90、TJ55、AZ88、WL15、YX86等仿冒手段不断提高的伪钞的出现,对人民币的鉴伪技术提出了一种更高的要求。提出了一种基于人民币凹版印刷特性,利用普通平板扫描仪进行钞票的伪双目立体成像,对其浮雕纹理进行计算机自动识别,进而实现真、伪钞鉴别的新方法。通过实
减少分布式程序的执行时间是网格调度系统需要解决的重要问题。因分布式程序常建模为DAG图,故该问题又称异构DAG调度问题。在研究网格环境下的任务调度的基础上,提出了一种用
在2013年春夏,沙滩裤的流行紧跟潮流。在颜色与廓形上不同于以往,都有了显著的变化。廓形不同与以往过膝的长度,2013年春夏男式沙滩裤的长度更多见的是7—9英寸(见图2)。短平的款
图的稀疏化是图聚类分析中数据预处理的关键操作,已得到广泛的关注。针对图数据日益普及、规模不断增大的现状,提出了一种基于MapReduce的面向大规模图的稀疏化算法,即MR-GSpar
碱氧一浴前处理后采用CTA—D2除氧酶去除过氧化氢,对其应用条件进行了研究,得出的最优工艺条件为:CTA—D2酶0.2g/L,pH值6.0-7.0,温度45℃,处理时间15min。将该工艺与传统工艺作比较,并进
去年5月,我随自治区统战部长培训班到广州、深圳、珠海、香港、澳门考察,感受很深.给我留下最深印象的是香港中央图书馆.参观香港中央图书馆是考察安排中所没有的.但因为有一
街拍作为当下流行于青年群体的一种都市文化,它是源于欧美国家的文化,它最早是源于时尚杂志收集潮流信息的需求,用相机捕捉街道上的时尚元素,同时传递了来自民间的流行信息,于是所
2011年的夏季,是一个绚烂色彩的季节。随着各大国际时装周的落幕,2011夏季流行服装也悄然绽放,时装周上无论是奢侈品牌,还是时尚品牌,纷纷注入了流行元素,街头愈来愈靓丽的颜色让人
职业装具有劳动保护功能,又体现企业的精神与形象,越来越受到人们的重视,本文介绍了它的分类和要求,从“度身定做难”,设计缺乏针对性,品牌化、个性化少,产品的档次低等方面分析了面