MLLR特征的SVM语种识别算法

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 5次 | 上传用户:yczhudong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了挖掘更多语种间区分性信息进行可靠的自动语种识别,本文提出一种将自适应领域的最大似然线性回归(maximum likelihood linear regression,MLLR)矩阵作为特征的语种识别算法。该算法首先对每个语种训练Gauss混合模型(Gaussian mixture model,GMM),然后对每个语音段在所有语种的GMM上计算MLLR矩阵。将得到的多类MLLR矩阵经归一化后拼接形成超矢量作为特征输入支持向量机(support vector machine,SVM)分类器进行训练和识别。本文比较了均值方差和排序两种归一化方法,并将本文提出的多类MLLR-SVM算法与传统GMM语种识别算法进行对比。实验表明,排序归一化算法优于传统的均值方差归一化;建立在GMM模型基础上的MLLR-SVM系统性能有9.7[%]的提升,并与GMM分类器有很强的互补性。
其他文献
The rupture process of the May 12,2008 MS8.0 Wenchuan earthquake was very complex. To study the rupture zones generated by this earthquake,four dense temporary seismic arrays across the two surface br
期刊
据日前有关报道,日本帝人テクノプロダクッ公司制造出售的对位芳纶"テクノ|ラ",被独立行政法人海洋研究开发机构(JAMSTEC)开发的大深度小型探查机"ABISMO"采用,用
期刊
Precise information about the spatial variability of soil properties is essential in developing site-specific soil management, such as variable rate application of fertilizers. In this study the sampl
期刊
Severe sex ratio imbalance at birth is now becoming an important issue in several Asian countries. Its leading immediate cause is prenatal sex-selective abortion following illegal sex identification b
期刊
提出一种无失真图像逐步传输法,该方法改进了Chang等人的早期PIT方法。原方法由于没有考虑到各图像区域的意义,解码初期的图像质量不够理想。为此,提出以"优先位图"表示区域的复杂度,利用这种优先位图可在传输的初期就将图像的重要特征发送给接收方。实验结果表明,该方法在峰值信噪比和视觉质量两方面均优于过去的无失真图像逐步传输方法。
期刊
将商空间粒度计算理论引入到了图像检索领域,提出了一种新的图像检索方法。首先针对彩色图像在不同粒度下的表现得到不同粒度下的颜色特征,获得不同的商空间,然后根据商空间粒度合成原理对已得到的商空间进行合成,进而以合成后的属性函数来完成图像检索。与采用单一颜色特征的图像检索方法相比,采用多粒度颜色特征的图像检索方法能够在更大程度上利用图像自身所提供的信息,实验结果验证了该方法的可行性和有效性。
期刊
羊绒与细羊毛的主要辨识依据是两者的表皮鳞片模式。该领域内常用的一项技术是分析纤维的SEM图像,通过鳞片边缘高度来区分两类纤维,但其成本高昂,且有8%的误差。该文提出区分两类纤维的新方法,首先将显微摄像系统获取的纤维图像处理成单像素宽度的二值骨架图,通过该二值骨架图提取纤维鳞片的4个相对形状参数,构建贝叶斯分类模型。数值实验表明,尽管该模型是基于光学显微镜的,但其分类性能却相似于基于扫描电镜的模型,
期刊
二值图像恢复往往按灰度图像恢复和阈值分割两步来处理,效果不佳。该文利用二值图像的特有性质,提出一种二值图像恢复的非线性正则化方法。同Tikhonov正则化方法不同,该文提出的方法最终归结为一个非线性最优化问题,并采用全局Barzilai和Borwein梯度算法求解此优化问题。实验结果表明,该文的二值图像恢复算法是可行的、有效的。
期刊
In radio frequency identification (RFID) systems,tag collision arbitration is a significant issue for fast tag identification. This article proposes a novel tag anti-collision algorithm called framed
期刊
该文分析讨论了连续语音识别系统中的快速高斯计算问题。语音信号的短时平稳特性,使得相邻语音帧可能共享相似的分布。最大概率增量估计算法利用该特性,估计当前帧与基准帧间似然值增量的最大值,以减少似然值的精确计算量。该文针对该算法中增量上界被高估的问题,在增量上界平滑、最优G auss候选、风险因子设定等方面进行了改进。实验结果表明,在几乎不损失识别率的情况下,改进后的M P IE算法可节约40%的维数计
期刊