一种联合语种识别的新型大词汇量连续语音识别算法

来源 :自动化学报 | 被引量 : 0次 | 上传用户:lele5126596
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明,音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.
其他文献
<正> 尿失禁是使患者在精神上、肉体上非常痛苦的一种疾病,而治疗上多属被动的对症处理,缺乏主动的积极治疗措施,更无特效疗法,故使患者对本病的治疗常易丧失信心。笔者于197
本文概括介绍利用煤的完全转化生产高热值城市煤气的途径及气化过程的理论计算;简要介绍目前处于技术开发阶段的几种生产高热值煤气生产工艺的物料平衡及热量平衡数据。
对昔日美好事物的追恋、渴慕和怀归情结是张岱创作《陶庵梦忆》的心理动因。通过这些"梦""忆"意象,张岱隐隐地显露出对晚明生机勃勃、人情放逸的时代的肯定、赏悦和颂赞。
目的研发感染性阴道疾病(细菌性阴道炎、滴虫性阴道炎和霉菌性阴道炎)的特异性单克隆抗体。方法分析感染性阴道疾病病原体的基因谱,扩增特异蛋白的基因序列,基因工程重组抗原
新课程理念强调以学生为本、强调与社会、与学生现实生活的联系。这一思想可以说是与上个世纪30年代陶行知先生提出的生活课程理论一脉相承。所以说,陶行知的生活教育理论与
现如今高中生"弃考"已成为一种普遍社会现象。本文基于贝克尔的人力资本投资理论,利用净现值法与教育投资分析模型研究发现,城市务工者工资的大幅提升会直接影响农村高中生对
在企业原有的经济契约之外,心理契约被认为是吸引、激励、保留人才的一种有效竞争工具。本文提出在企业管理中应构建有效的心理契约,从而提高企业管理效能,提升企业的核心竞
<正>"网络游戏"简称"网游",这是相对于单机游戏而言的。"百度"将其定义为以互联网为传输媒介,以游戏运营商服务器和用户计算机为处理终端,以游戏客户端软件为信息交互窗口的
概述了钒酸铋的物理化学性质,归纳了其主要的制备方法,重点阐述了纳米钒酸铋光催化降解有机物污染物及其光催化反应机理,探讨了其在环境中的应用。最后,对钒酸铋光催化剂的研
党的十八大以来,党中央提出深入推进反腐败斗争要抓早抓小,体现了从源头上防治腐败的新思路,是反腐败工作从被动走向主动的重要举措。施工企业加强党员干部监督,建立"抓早抓