一种基于带语言模型并行音节解码器的语种识别系统

来源 :2007年全国网络与信息安全技术研讨会 | 被引量 : 0次 | 上传用户:jokylin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了中科院声学所研发的电话语音多语种识别系统。该系统采用多音素解码器并行处理框架,其中每一个解码器对每个目标语种都构建了N元语言模型─它表征了目标语种在语法层上的内在联系。多解码器对测试语音并行解码后,生成多个音节序列;依据相应的语言模型,计算这些音节序列在每一个目标语种上的概率似然值,由此生成一个以似然值为内容的得分矢量。最后,以支持向量机作为得分矢量的分类器,生成测试语音对每个目标语种的后验概率,并做最终判决。
其他文献
无监督的聚类算法在中文网络信息处理中有着广泛的应用。由于存在大量的中文词语,适当的特征提取算法,可以降低计算资源消耗,提高聚类质量。但当前使用的无监督特征选取算法
会议
在目前的Web信息提取技术中,很多都是基于HTML结构的,由于HTML结构的经常变化,使提取模板需要经常更新,而提取模板的更新需要很多领域知识。本文提出一种基于显示属性的Web信
WEB文档聚类在新闻信息检索领域起到重要的作用。但由于新闻领域不断涌现出一些新的名词。现有的技术在文档特征抽取和权重计算、类标签生成方面存在不足,导致聚类质量下降。
会议
随着中文网络的快速发展,对于网络中海量中文数据的实时处理成为一个引人关注的话题,而中文文本的自动分词技术是中文信息处理系统的重要基础部分,直接关系到系统的处理效率
会议
随着网络技术发展,根据用户兴趣进行网络信息过滤的需求越来越大。网络信息过滤的核心技术是分类算法的应用,即根据专家事先标记的样例建立用户兴趣描述模型,应用模型实现信
一九八○年四月英国第一次颁发国家书籍奖。这项奖是一九七九年六月份由艺术协会发起的。艺术协会是英国政府属下的一个机构,它的宗旨是支持和鼓励英国的作家、艺术家、音乐
汤草元:昨天晚上大家看了《红色宣传員》,这是一个很好的戏。剧本好,演出也好。看后感受一定很多。今天是上海市妇女联合会和中国戏剧家协会上海分会联合召开的座談会。邀請
话题发现与跟踪(Topic Detection and Tracking, TDT)是一项由国际公开评测驱动的研究,旨在依据事件对语音和文本信息进行分析和组织。自1996年启动以来,该研究受到普遍关注,
会议
本文提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,我们利用维
在当今网络化与数字化时代,随着播客类网站如火如荼的兴起,如何有效地管理网上视频数据,抵制色情、暴力影像,保障网络安全已成为信息领域一个亟待解决的问题。本文通过对网络
会议