基于语音的身份识别系统的研究与设计

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:akaiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于语音的身份识别是指通过对说话人的语音信号的分析和特征提取,从而确定说话人是否在所记录的说话人集合中,进而确定说话人是谁的过程。随着计算机技术和信息化社会的发展,说话人识别技术越来越受到重视,它在许多领域内都有良好的应用前景。本文通过分析说话人识别基本原理与系统结构,考察现有的说话人识别技术,研究采用线性预测倒谱系数和美尔倒谱系数为特征参数,运用矢量量化的说话人识别方法,建立说话人识别系统。目前在说话人识别中,要提高识别率有两个重要问题需要解决:一是如何选取能够有效表征说话人特征的可靠参数;二是如何选取最佳的识别模型和模式分析方法,使计算简单可靠。本文对说话人识别系统的设计与实现作了初步探讨,主要做了以下工作:(1)本文在研究语音信号的一般处理方法的基础上,研究了语音信号的数字模型,包括激励模型、声管模型和辐射模型三个子模型。(2)在研究说话人识别的参数和特征提取原理的基础上,重点研究了线性预测倒谱系数(LPCC)、美尔倒谱系数(MFCC)等特征参数的原理和特点,并在计算机上提取和比较了LPCC和MFCC参数的识别效果。实验表明采用MFCC参数比采用LPCC参数有更好的识别效果。训练时间越长,两种参数的识别效果越好。(3)在介绍各种建模方法基本原理的基础上,重点研究了矢量量化器最佳码本设计的算法—LBG算法,并选择为本系统的矢量量化方法。设计了基于矢量量化的说话人识别方案,并在MATLAB上进行了仿真实验,基本实现了说话人识别。最后,对系统进行了改进,并介绍了模式分析中的一种核方法:新颖检测法,将之用于说话人识别。目前说话人识别技术在实用中遇到的最大问题在于系统的噪声的稳健性。如何在噪声环境发生变化的情况下保持系统性能不下降,将需要进一步的研究和实践。随着相关学科的发展,一些更实用、更高性能的说话人识别系统,必将出现并广泛应用在人们的现实生活中。
其他文献
随着计算机网络的普及和发展,远程教育是网络多媒体技术应用的一个重要方向。它突破了时间和空间的限制,为广大的学习者提供了极大的方便。实时视频教育是远程教育的一个重要组
随着人类文明的不断发展进步,网络逐渐成为人们生产和生活的重要工具。大数据时代的网络系统变得极其庞大复杂,因而亟需加强网络可靠性的建设。利用二元决策图(BDD)技术分析
学位
本文的主要构想是如何在基于Linux服务器的条件下糅合各种技术构建和实施分布式多层应用系统。多层分布式应用是在客户端和服务器之间加入了一层或多层应用服务程序。随着多
自从BP神经网络被成功地运用于时间序列分析上,人工智能技术受到了大家的热点关注。作为人工智能领域的一种新方法,SVM(Support Vector Machine,支撑向量机)以其独特的优点脱
近年来,我国通讯市场的拆分、重组使得通讯企业之间的竞争越来越激烈,企业的决策对通讯行业格局的影响显得越来越重要。通讯企业的经过近年的发展,逐步建立了比较完善的计费系统
网格计算是典型的分布式计算,网格系统是典型的分布式系统。近年来对于网格环境下各种技术的研究已经成为计算机领域的一个热点问题,其中的任务调度,任务协同以及资源协同等
遗留软件大都是面向对象技术在软件开发中广泛使用之前编写的,它们已经深深的融入企业的业务运行之中。为了节约资源,充分利用已有的成果,遗留代码重用不可避免。本文提出了L
在过去的十年中,科学计算正从主机集中方式转移到并行和分布方式。近年来这一趋势更向着网格计算延伸。网格是当前并行与分布式计算技术的一个重要发展方向,其目标是实现对地理
长期以来,煤炭采掘行业产量难以核实,计量不准确,税务部门很难掌握其生产情况,税务部门在加强煤炭行业税收征管方面尽管采取了多种措施,但是煤炭行业税收管理中的问题仍没得到根本