多语言语种识别技术的研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:magicylt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多语言语种识别(LID)技术在多语种语音信息服务,多语言语音识别系统、多语言语音翻译系统和多语种广播节目监控系统中都起着很重要的作用。本文面向多语种广播节目监控的实际应用,对语种识别的预处理、语种识别及其置信度技术和语种识别系统进行了研究。主要内容如下:   ⑴在语种识别的预处理方面,研究了如何去除真实音频信号中的音乐和噪声等非语音成分以提高语种识别的性能。结合曲线观察和性能分析,对16种音频特征区分不同两种音频类型的有效性进行了详细分析,在此基础上提出了一种基于支持向量机的音频分类方法。该方法首先基于能量门限,把音频信号分成静音段和非静音段,然后借助SVM分类器,把非静音段进一步分成纯语音、非纯语音、音乐、环境音4种类型。同传统的GMM和KNN方法相比,实验结果表明该方法具有更加优越的性能。   ⑵研究了高斯混合模型在语种识别中的应用,主要包括特征提取、模型自适应和分类判决等问题,其中特征方面使用移动差分倒谱(SDC)特征代替传统的MFCC特征,分类判决方面使用混合高斯后端(GBE)分类器,由于SDC特征包含更长的差分特征信息,而GBE分类器带有线性判别分析(LDA)模块以进一步区分模型得分,从而可以显著提高系统的识别性能。   ⑶将统计学习理论中的支持向量机建模方法引入到语种识别中,研究了大样本情况下SVM用于语种识别的区分性训练问题。通过使用多项式映射、最小均方误差准则算法和广义线性判别序列核函数,不仅大大减少了训练样本的数目,而且使得训练样本具有较强的区分性,从而保证系统具有较高的识别率同时,训练和识别速度大大提高。在此基础上,本文研究了辨别模型的语种识别置信度问题,提出了一种基于SVM模型得分Sigmoid变换的识别置信度方法。最后本文通过使用GBE分类器,把SVM识别系统、GMM-UBM识别系统和PPRLM识别系统在得分层次上进行融合,在OGI-TS数据集和NIST评测集上都取得了较高的系统性能。   ⑷在分析多语种广播音频信号特点的基础上,把语种识别技术和固定音频检索技术相结合,设计并实现了一个面向多语种广播节目监控的语种识别系统。该系统应用了音频分类技术、语音质量评估技术、固定音频检索技术、消除噪声技术、语种识别技术和识别置信度量等多项技术。实验结果表明,该系统不仅具有实时的处理速度,而且具有可靠的识别性能,可广泛应用于广播、电视、电话以及互联网的音频内容实时监控与管理行业。
其他文献
本文主要致力于使用ZigBee技术来设计三表之一的水表无线抄表系统,应用无线技术来实现水表的定时自动抄表功能。较为完整地介绍了ZigBee技术的相关概念、协议及其技术支持;较为
本文针对“改善重度网络负载时CAN总线系统的实时性能,并同时提高网络资源利用率”这一目标,从总线资源调度的角度,对FTT-CAN协议中同步时间窗口的通信机制稍作改进:在协议信息中
近年来随着电子技术和生产制造工艺的迅速发展,以ARM、单片机为微处理器的嵌入式技术在工控等领域的应用日益广泛,其具有高可靠性、高性价比、高度集成化等特点,这为加弹机控制
伴随着德国“工业4.0”概念的提出,我国也相继推出了“中国制造2025”、“互联网+制造”等一系列概念。这些概念的提出都旨在加强制造业产业的转型,提升生产效率。汽车装配制造
海洋资源十分丰富,世界各国正积极实施一系列海洋开发战略,另一方面,远洋运输等活动也日益频繁。随之而来的,海上事故也频繁发生。海上事故的发生不仅导致惨重的人身伤亡和巨大的
随着兵器工业高新技术的发展和应用,现代常规兵器正在向着高速度、高精度、强突防、高威力和远程化等方向发展。现代军事技术发展的客观环境,迫切需要发展超高速、高动能武器,对
该文首先分析了小电流接地故障暂态信号频域特征,重点在于一特征频段(SFB—Special Frequency Band)内暂态信号分布规律,其可作为故障检测的依据.通过建立基于线路分布参数的
随着社会的发展和科技的进步,在追求经济利润的同时,人们也越来越关注安全问题,因此安全仪表系统在工业生产中得到了广泛的应用。合理的安全仪表系统可以保证工艺过程的安全运行
针对目前市场上的热量表无论在精度、稳定性还是质量方面都还不能满足热量表检定标准的要求,本文设计了一种以超声波流量测量为原理的便携式热量表检定仪,让它实现高精度的测量,来检定户用型热量表的精度是否满足要求。这样不仅满足供热体制的要求,还能使用户更加放心的接受热量表,提高他们的节能意识。本设计以80C196KB单片机为核心,选用相应的超声波式流量传感器和温度传感器实现对流量、温度的测量,可显示相关参数
机器人从诞生至今已有50多年历史,已经越来越广泛地被应用到工厂、社区、家庭、医院、酒店、银行等环境中。特别是在工业生产领域中,装配、焊接、搬运等各个环节都有机器人忙碌