与文本无关的说话人识别系统研究

来源 :山东轻工业学院齐鲁工业大学 | 被引量 : 0次 | 上传用户：naizhi1006

【摘要】

：

说话人识别就是利用人的语音自动对其身份进行鉴别与认证的技术。说话人识别具有广阔的应用前景，已经成为身份认证及人工智能领域研究的一个热点。从20世纪30年代发展至今已经

【作者】

：

高会贤

【机构】

：

齐鲁工业大学

【出处】

：

山东轻工业学院齐鲁工业大学

【发表日期】

：

2008年期

【关键词】

：

说话人识别语音自动识别身份认证文本无关模式匹配特征提取高斯混合模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别就是利用人的语音自动对其身份进行鉴别与认证的技术。说话人识别具有广阔的应用前景，已经成为身份认证及人工智能领域研究的一个热点。从20世纪30年代发展至今已经有许多比较成熟的说话人识别理论模型。为了提高说话人识别系统的性能，主要是识别率和稳定性，本课题针对说话人识别的两个关键环节，特征提取和模式匹配展开研究，对原有的一些特征和匹配方法进行了改进，寻找出了更加简单有效的算法。主要内容如下：特征提取：研究了目前现有的几种用于说话人识别的主要特征参数，其中包括线性预测倒谱系数(LPCC)、美尔倒谱系数(MFCC)以及动态特征参数。模式匹配方法：对当今应用在与无本无关的说话人识别中效果较好的基于矢量量化(VQ)和高斯混合模型(GMM)的模式匹配方法做了深入的研究和改进。经过对上述两个问题的重点研究，本文提出了三种不同的说话人识别算法： (1)基于MFCC+质心和VQ的说话人识别算法经过对矢量量化方法的研究，通过对特征参数、码本大小和失真测度等的选取做的比较实验，提出了基于MFCC+质心和VQ的说话人识别算法。该算法提取不包括Co在内的前12个MFCC分量和质心构成的13维的组合参数来表征语音的个性特征。此算法的优点是计算简单，识别速度快。但也存在着在语音较短条件下识别率较低的缺点。 (2)基于MFCC+△MFCC和GMM的说话人识别算法考虑到(1)中所述的基于MFCC+质心和VQ的说话人识别算法用在语音较短条件下识别率较低的缺点，又对高斯混合模型进行了研究，提出了基于MFCC+△MFCC和GMM的说话人识别算法。该算法提取MFCC分量的C2-C13以及它们的一阶差分系数△MFCC组成的24维的特征向量来表征语音。经实验表明，即使在语音较短的条件下，此方法也能得到比较高的识别率，但存在着识别速度较慢和识别结果不稳定的问题。 (3)基于VQ-GMM的稳定高效的说话人识别算法为解决(2)中基于MFCC+△MFCC和GMM的说话人识别算法用于说话人辨认实验出现的识别结果不稳定的问题，将矢量量化和高斯混合模型成功进行了结合，提出了基于VQ-GMM的说话人识别算法。在这一算法中高斯混合模型的初始化参数来自于矢量量化的结果。提取的语音特征参数仍然是MFCC+△MFCC组成的24维的向量。与传统的初始化方法相比，将此算法用于语音较短的说话人辨认实验，识别率更高，更稳定。以上三种算法用于我们自己录制的50人的语音库进行说话人辨认实验中都取得了比较好的结果，可以根据需要应用在不同的场合。目前针对说话人识别的应用普遍性比较强，而针对性不够。因此，未来的工作主要是从语音信号中寻找具有较好鲁棒性和实时性的说话人语音特征，以及具有更好实效性的识别方法。另外还要考虑到现在说话人识别技术市场性不够的问题，在以后的研究中多针对实用中的某一方面进行深入的探讨。

其他文献

一种改进的快速层次移动IPv6方案研究

移动IPv6机制可以在全球互联网范围内提供移动数据解决方案，使移动节点可以使用一个永久的IP地址连接到任何链路上。但是，由于存在切换时延和服务质量等问题，移动IPv6缺乏对实时

学位

基于XML的网络服务体系结构的建模与仿真

论文重点展开了对面向服务的网络体系结构建模方法的相关研究。首先介绍了网络服务体系结构的参考模型INSA模型，分析了INSA模型的优点与不足。在此基础上，重新定义了若干建模元

学位

网络体系结构网络服务可视化建模XMLTCP协议网络设计

基于嵌入式操作系统的车用数据采集仪设计与实现

随着中国汽车行业迅猛发展,电子技术已应用到汽车各个领域,CAN总线的广泛使用为车内信号采集仪器提供了一种新的手段。本文基于μC/OS-Ⅱ嵌入式实时操作系统,选用MC9S12XD系

学位

图像处理软件网格服务封装和生成技术研究

图像处理技术在当今互联网领域已经有了很广泛的应用,伴随着软件服务化和网格等互联网技术发展,图像处理的服务计算及软件共享成为目前生物、医学领域图像处理的趋势。借助于

学位

网格服务封装交互式软件服务图像处理交互操作映射

基于MIPv6宏移动切换管理方案的研究

移动IP是目前唯一支持因特网主机移动的标准。移动IPv6是在移动IPv4基础上发展起来的，它给IP网络带来了一些新的特性，使得IP协议在地址管理、移动性、安全性及多媒体支持方面都

学位

基于兴趣圈的多Agent协作研究

作为多Agent系统目前研究的关键问题之一,Agent协作日益受到关注。Agent之间通过协作比单个Agent具有更强的问题求解能力和更高的智能性,已成为解决大型复杂问题和分布式问题

学位

智能代理多代理系统协作通信兴趣圈

关于正则图的圈边连通度判定算法

一个网络可以用一个连通图来表示，其中图的顶点表示网络中的组件，边表示两个组件之间的通信信道。图的连通度可以衡量网络的稳定性。一般来说，一个图的连通性越好，它所代表的网络

学位

正则图圈边连通度时间复杂度围长

基于群体智能的微博公众情感预测方法

由于微博的快速发展,越来越多的互联网用户倾向于使用微博发布有关热点话题的信息。微博中不仅包括相关事实描述的客观信息,也蕴含着微博用户所特有的主观信息,如态度、看法

学位

微博情感分析公众情感

水下结构检测ROV的研制及导航定位研究

遥控水下机器人(Remotely Operated Vehicle,ROV)是进行水下作业的有效工具,能够执行勘探、检修、巡查等任务。随着海洋资源的不断开发,很多水下结构物需要周期性的检测与清

学位

水下机器人上位机微惯性导航动力定位

基于RIA技术的WebGIS系统应用性能研究

近年来,WebGIS在理论、技术、产品以及应用上都取得了很大的进步,其发展有力地推动了地理空间数据的广泛应用。然而由于GIS领域自身特点使其开发受制于Web技术的发展水平,出

学位

与文本无关的说话人识别系统研究

与本文相关的学术论文