基于高斯混合模型的语种识别技术

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语种识别就是用计算机来自动识别一段发音所属语种的一项技术,它是在语音识别基础上发展起来的。随着语音识别技术的不断发展,语种识别作为语音识别的一个方面和它具有的重大意义,也越来越受到人们的广泛重视。从上个世纪七十年代到现在,语种识别虽然只经历了短短几十年的发展,但识别方法已有多种。这些方法虽然各有特点,但比较成熟的方法还不是很多。目前,我国对语种识别的研究较少,尚处于起步阶段。 语种识别与传统的语音识别虽然有一些相似之处,但也存在许多不同的地方。语种识别强调在与文本无关和与说话人无关的条件下进行,因而语种识别需要尽量消除语音信号中个体发音的差异,并且尽量找到不同语种的语音间不同的声学特征,从而达到更好的识别效果。 本文通过利用语音的美尔倒谱系数为每个语种建立高斯混合模型的方法对语音信号进行语种识别,从两个方面对语种识别过程进行讨论:一方面从语音的声学特征入手,对不同语言间所含的不同的特征信息进行深入的分析,从而找到对不同语种进行识别的依据;另一方面讨论高斯混合模型的原理和算法,分析高斯混合模型在识别过程中所出现的问题和提出解决的方法。 最后,本文通过具体实验对影响系统识别性能的因素进行深入分析,并加以归纳和总结,指出今后努力的方向。
其他文献
近年来,混沌控制与同步的研究引起人们极大的兴趣,并成为当前混沌研究的一个热点。混沌控制与同步的发展不仅为非线性动力学与控制领域的旧问题提供圆满的解答;也带来了新的
随着互联网的发展,社会化媒体逐渐成为人们获取信息与发布信息的主要方式。截止2016年底,全世界的互联网用户数目达到了35亿,而作为社会化媒体代表之一的 Facebook月活跃用户数
本文在前人研究的基础上,结合传统的密码学和新兴的数字水印技术,提出一种基于密码学的数字水印技术。主要研究工作如下: 1.针对Logistic混沌映射在现实应用中由于计算机有限
动画自动生成技术(AutomaticGenerationofComputerAnimation)由中科院数学所的陆汝钤院士提出,它是人工智能技术与电影艺术,图形学技术的结合,是以底层图形学技术为支撑,在上层运
进入21世纪以来,软件测试在软件工程中的比例、复杂度、成本越来越高,软件测试研究成为软件界共同瞩目的焦点。对软件测试辅助的研究始终围绕着质量、成本、时间三大要素进行
随着信息技术的不断发展,特别是Internet应用的普及,电子化文本数量迅速增长。为了快速的处理和查询所需要的文本信息,要求能够有效地组织文本。文本分类技术常被用于大量文
随着移动通信的发展,频谱资源显得日趋紧张,使得人们努力开发高效的编码、调制以及信号处理技术来提高无线频谱的利用率。作为改善CDMA系统性能的一种努力,在理想扩展码产生的基
H.248协议是目前主流的媒体网关和媒体网关控制器之间的通信协议。为了保证不同厂商的媒体网关在相同的媒体网关控制器下能够协同工作,根据协议规范对协议实现进行协议一致性
随着计算机图形学技术的发展和广泛应用,巨型网格的交互绘制成为近年来计算机图形学的一个研究热点。为了实现网格交互绘制,首先必须利用网格简化方法生成网格的多分辨率表示模
查询重写作为数据集成中的一项核心技术,在集成或发布系统中有重要应用。随着Internet技术的发展,XML成为异构数据集成中的数据交换的中间形式,针对XML模式作为全局视图的查询重