基于音素混淆网络的蒙古语语音关键词检测方法的研究

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wxxflystar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蒙古语语音识别系统的词表很难覆盖所有的蒙古文单词,并且随着社会的发展,蒙古文的新词和外来词也越来越多.为了解决蒙古语语音关键词检测系统中的集外词检测问题,该文提出了基于音素混淆网络的蒙古语语音关键词检测方法,并采用音素混淆矩阵改进了关键词的置信度计算方法.实验结果表明,基于音素混淆网络的蒙古语语音关键词检测方法可以较好地解决集外词的检测问题.蒙古语语音关键词检测系统采用改进的置信度计算方法后精确率提高了6%,召回率提高了2.69%,性能得到明显的提升.
其他文献
上海为了“节省天光”,将所有的时钟都拨快了一小时。
在近来出现的面向实体的搜索服务中,准确地预测实体间的相关程度是至关重要的。该文提出了一种基于实体的事实知识,即利用"实体—属性—属性值"(SPO)记录进行实体相关度计算的方
如今,弄堂口隐约传来的叫卖声,早已经隐在了青苔遍布的石砖上,偶尔才能吃到的光明冰砖早已经隐在了知了喳喳的喧嚣里,冰冰凉凉的味道早已经隐在了柏油马路粘粘的沥青里,而那些孩子
一家已有7年多历史的老牌日本料理店,纯正地道的风昧以及实惠的价格,无疑是她一直门庭若市的原因。环境典雅,临窗是一排翠绿的竹,将炎炎烈19阻隔,隐约带来清新自然的竹林风。餐厅
《全球华语大词典》是《全球华语词典》的升级版,是一部反映世界主要华语区当代华语词汇面貌的大型语文辞书。主要收录全球华人使用的华语词语,包括中国大陆(内地)、
目前,生物医学文献的数量正在呈指数的方式快速增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设。但传统的基于简单共现的方法会产生大量的目标词,导致很
中文特征词的选取是中文信息预处理内容之一,对文档分类有重要影响。中文分词处理后,采用特征词构建的向量模型表示文档时,导致特征词的稀疏性和高维性,从而影响文档分类的性
世界上可以与中国餐馆在数量与欢迎度上并驾齐驱的只有意大利餐馆,意大利披萨、意大利通心粉简直就是全球共通语言,意大利是“吃文化”的强势主流,背后丰富的食材与高超的厨艺支
隐式篇章关系分类是篇章分析领域的一个重要研究子任务,大部分已有研究都假设参与分类的正类样本和负类样本数量相等,采用随机欠采样等不平衡数据处理方法保持训练样本中数据
基于转化的广告方式在应用和研究中逐渐得到重视,采用该方式的搜索广告在广告排序时需要对候选广告的转化概率进行预测,以提高广告的转化率,优化搜索引擎的广告收益。该文在