基于高斯混合模型和语言模型的语种辨识研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:silvercup
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种辨识是计算机通过分析处理一段语音信号以判别其属于何语种的过程。该技术是近年来语音识别领域的一个新的研究热点,可广泛应用于多语种信息服务和军事安全领域。   目前大多数的语种辨识系统都是基于连续语音识别的,以音素及音位配列信息来对语言建模。基于音位结构学方法的基线系统PPRLM在语种识别评测中具有较好的识别性能,但是系统扩展性差。   本文主要研究与文本无关的语种辨识方法,利用高斯混合模型和语言模型建立语种辨识系统。论文的主要工作有:   (1)利用高斯混合模型的声学系统近似的表示音素识别器,建立了基于高斯混合模型符号标记器和语言模型(GMM-LM)的语种辨识系统。这种方法不需要掌握各语种的专业语言学知识,系统扩展性比较好。GMM-LM语种辨识系统结合了声学方法和音位结构学方法。   (2)语音特征信息分为低层声学信息和高层语言学信息。近年来,特征信息的选用成为语音处理领域研究者不断关注的热点问题。本文提取动态的高层语言学特征建立了改进的语种相关的、联合的GMM-LM语种辨识方案,改进的语种相关的联合的GMM-LM系统减小了高斯混合模型和语言模型之间的相关性。   (3)提出了基于特征提取层和判决层融合技术的语种辨识系统。该系统利用了不同类型的特征对区分不同语种的贡献来增加不同语种语料之间的差异,并使相同语种的语料之间的差异减小。   实验表明,本文设计的基于高斯混合模型和语言模型的语种辨识系统具有较好的扩展性。同时基于特征提取层和判决层的融合系统能够有效的提高系统识别率。
其他文献
RFID(Radio Frequency Identification)射频识别是一种非接触式的自动识别技术。它利用射频信号来自动识别目标对象并获取相关数据,识别过程无需直接接触与人工干预。随着技术
随着网络技术的发展,更多的商业应用服务开始由网络承载,新兴的语音、视频等多媒体业务大量在网络上应用,不可避免的会出现链路失效、节点失效等网络故障,这对网络的生存性和
说话人识别是一种模式识别技术。通过对采集到的语音信号提取相应的特征,建立相应的模型,然后判断说话人身份。说话人识别在电子商务和信息安全等领域都具有广泛的应用前景。 
等级(Hierarchy)普遍存在于群居动物和非人灵长类中,等级优势往往会影响动物对食物资源,空间资源以及交配资源的占有。而在群居生活中,不同等级的动物通常会采取不同的策略来增强
正交频分复用(OFDM, Orthogonal frequency division multiplexing)技术可以有效地对抗多径衰落,消除符号间干扰(ISI,Inter-Symbol Interference),具有较高的频谱利用率,已经
数控系统是现代制造技术关键和核心技术,是衡量一个国家制造水平的重要标志之一。近年来,随着嵌入式系统、微计算机技术和集成电路的迅速发展,数控系统向高速、高效、高精度、高
随着人们开发和利用海洋的步伐加快,水下数字通信技术的研究越来越受到重视,逐渐成为水声研究领域中最具挑战性的课题之一。在水声通信信道中广泛存在着多径传播现象,而由此引起
学位
射频功率放大器是射频通信系统终端的主要器件。随着通信技术的发展,特别是第三代无线通信技术(3G)运用,对射频功率放大器有了更高的要求。3G无线通信技术,使用了相对于2G更高的
人脸识别是一项极具有发展潜力的生物特征识别技术,研究人脸识别技术具有十分重要的理论意义和应用价值。最近几年,人脸识别技术取得了前所未有的发展,但其在实际应用中识别精度