基于支持向量机的语种识别方法的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ziqun666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球化趋势的加剧,国际间交流越来越密切,各国家和地区的人们因为经济、政治、文化、旅游的需要而频繁往来,使得人们迫切地需要能够突破语言的限制,自由地进行交往。因此自动语种识别((Language Identification,LID)显得越来越重要。LID能自动地识别出一段语音所属的语言种类,这在语音识别、自动机器翻译、国防和日常生活中体现出较强的应用价值,逐渐引起了相关研究和应用领域的广泛关注。 广义上说,自动语种识别可分成基于声学模型和基于音素搭配关系模型两类。另外,根据建模方法的不同,又可以分成产生性模型(Generative Model),如音素识别语言模型(PRLM)、高斯混合模型(GMM)和区分性模型(Discriminative Model)的方法,如支持向量机SVM。近年来将音素识别PR、GMM和SVM结合起来成为语种识别研究的一个主要方向。本文从声学空间的区分性建模方法出发,着重研究了基于支持向量机SVM的语种识别系统。首先介绍了其常用的声学特征及其鲁棒性方法,然后分析了不同核函数的构成,即广义线性区分性序列核GLDS和高斯混合模型超矢量核GSV,在此基础上提出了相应的改进,具体工作包括以下几个方面: 第一:从原理上对比了LPCC和MFCC在语种识别中的优劣,由此启发,将它们融合起可以获得较好的效果。另外对各种基于特征域上的鲁棒性方法在语种识别上的应用进行试验,最终给出了一个合适的提高特征鲁棒性的策略。 第二:针对原有的GLDS核函数存在训练、测试语句之间时长不匹配的问题,采取了层次化的结构,一方面将训练样本切分到和测试样本相近的长度,另一方面又通过样本选择,在控制样本数目的前提下保留了最具区分性的样本。这样在一定程度上减少了训练和测试之间的不匹配问题,又保留了其计算量小的优点。再结合多种特征之间的互补性,使系统性能提升30%。 第三:在GSV系统中,通过结合扰动属性投影NAP、因子分析FA等去噪方法和VTLN等手段,识别性能得到很大提高。另外,针对GSV系统的特征维数随GMM高斯数呈倍数的增长,且各维间存在冗余的现象,本文采用核主成分分析KPCA和关键特征选择(Key Selection)的方法,既起到了降维的作用,又突出了剩余特征维数之间的区分性,减少了运算量,提升了系统性能。
其他文献
快速跳频通信技术作为扩频通信体制中的一种重要类型,随着其在卫星通信等领域中的快速发展与广泛的应用,其系统的各方面性能将会随着需求的增加而面临着更多的考验。在快速跳
TETRA数字集群通信系统是基于时分多址的专用移动通信系统,主要应用于公安、交通运输以及政务等领域。网络管理子系统主要实现对数字集群网络的监测和控制功能,能够保证数字
随着新型移动多媒体业务不断涌现,为了利用有限的无线频谱资源来适应人们对物质文化的需求,传统蜂窝移动通信系统向宽带化演进。与此同时,宽带无线接入技术的发展极为迅速,它
2007年4月19日去北京,参加中国烹饪协会成立20周年表彰活动.20日中午,应《中国食品》杂志副主编林华女士之邀,与邱庞同教授、杜莉教授一起,去了位于东城区东四十条22号南新仓
基于位置的社交网络(location-based social network,LBSN)提供了用户的在线网络关系和签到(check-in)的空间时间等多重信息,连接了虚拟网络和现实生活,不仅丰富了人们的网络
一、中国饮食文化地域分布的基本现状rn饮食文化的地域性不是以行政区划来划分的,而是从历史形成的饮食特点这一角度来讲的.人类在维持生命和举行节日庆典时,渗透进自然、社
随着通信技术飞速发展和直放站的广泛应用,直放站监控系统在实时监测直放站的工作状态和远程控制方面发挥了重大作用,然而当前的直放站监控系统多采用单片机作为主控制器,通
电力线载波通信在我国是一门既古老又年轻的学科,作为电力系统不可或缺的通信手段,传统的模拟设备已不能完全满足现有市场对通信质量的要求。本文论述了电力线载波通信的发展
随着无线通信技术的飞速发展,非授权频段的使用日趋饱和。目前的频谱资源大多数采用固定分配方式,授权频段的信道资源丰富,但大多利用率极低。这种矛盾严重制约着无线通信业
随着无线通信技术的发展,无线通信技术遍及人们生活的每一个角落。然而与此同时无线频谱资源却越来越紧张。所以,一直以来无线技术的核心问题就是如何提高频谱的利用效率。近