电话语音语种确认系统算法研究

来源 :中国科学院电子学研究所 | 被引量 : 0次 | 上传用户:zhangsiqin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种识别技术作为信息处理系统的前端和多语种交流领域的接口,可以辨识语音的语种信息,为后续技术处理和交流者提供必要的条件,有着巨大的应用需求和价值。本文重点研究语种确认系统算法,主要围绕PPRLM(并行音素识别器接语言模型系统)语种确认基线系统中的三个问题进行:语种辨识系统中的语言模型改善、系统分类器融合策略、开集测试中系统性能。 语种确认系统的语言模型是其核心之一,为了提高语言模型的精度,本文采用段长作为置信度,提出了“基于段长的语言模型修正算法”,该算法结合段长置信度信息对语言模型进行估值,并与无段长置信度语言模型一起给出“修正因子”,用于修正语言模型估值,以此改善语言模型精度,提高系统性能。 本文研究了分类器的加权平均线性融合策略,利用“MCE权重优化训练算法”(Minimum Classification Error,MCE)估计分类器权重。研究了训练中各关键参数的影响,并分析了该训练算法存在的问题,提出改进措施,改善了融合系统性能。 针对开集测试,本文构建了“跳跃式”语言模型,得到多个时间层次上的模型,然后提出“多层语言模型融合算法”,提高了系统在开集测试的精度。在多层语言模型融合的基础上,本文提出了“基于背景模型的两阶段语种确认算法”。算法在不同阶段采用鉴别能力不同的背景模型,第一阶段采用“有限背景模型”,第二阶段采用“通用背景模型”,两阶段算法最终有效地降低了系统在开集测试中的错误率。 最后论文采用2005年国际NIST(American National Institute of Standardand Technology)语种技术评测数据库对采用本文算法的系统进行整体测试,分别对30s、10s语音进行闭集和开集测试,采用本文算法的系统均获得了等错率的降低,从而验证了算法的有效性。
其他文献
异向介质作为一种新型的人工电磁材料,是近几年来物理学界研究的一个热点。异向介质具有与普通介质完全不同的奇特电磁特性,因此它在通信、军事领域有巨大的应用价值。一维的
本文主要对绝缘栅双极晶体管(IGBT)的特性及其在大功率固态调制器中的应用进行了研究。通过分析、试验和软件模拟,对比了不同工艺、封装形式的IGBT产品作为高压脉冲开关的表现
射频识别技术是从二十世纪九十年代兴起的一项新的自动识别技术,它利用无线射频方式进行非接触双向通信,以达到识别的目的并交换数据。近年来,随着大规模集成电路、网络通信、信
本论文基于3次野外考察及标本采集,查阅云南大学植物标本馆蕨类标本室(PYU)及中国科学院昆明植物研究所标本馆(KUN)馆藏标本,对轿子雪山蕨类植物进行区系地理及生态分布研究。
2007年下半年,我国将发射自行研制的第一颗月球探测器——“嫦娥一号”月球探测卫星。激光高度计是“嫦娥一号”月球探测卫星的主要载荷之一,担任着获取月球表面三维高程数据的
鼓槌石斛是名贵的中药材,其多糖的含量较高,有较高的药用价值。本文研究了鼓槌石斛多糖成分的提取、纯化,优化了超声波提取法,分析了多糖的单糖组分,以及鼓槌石斛和金钗石斛的粗多
作为第三代半导体材料的GaN属直接带隙半导体,具有禁带宽度大、电子漂移速度高、介电常数小等优点。优越的物理化学稳定性使其可以在苛刻的条件下工作,适合制备多种器件。特别
甘油磷脂是维持生物膜形态与结构、保证细胞各种生理功能正常进行的重要生物大分子。甘油磷脂合成途径在高等真核生物和原核生物中已经研究得比较清楚,均为“从头”合成途径。
学位
近年来,随着免疫技术和MEMS技术的发展,磁珠以其具有比表面积大、偶联容量高、操控方便等优点,被越来越多的应用于微流控芯片中,以构建磁珠微流控分析系统,为生物样品分离、检测提
傅立叶变换光谱技术具有多通道、高光通量、高光谱分辨率以及光谱准确等众多优点,是未来空间遥感技术和大气探测技术的主要发展方向之一。风云四号气象卫星上将装载一台干涉式