说话人识别中的特征参数提取研究

被引量 : 0次 | 上传用户:xiao959907530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据人的声音来识别说话人身份的生物认证技术。随着网络与信息技术的发展,其应用前景受到越来越多人的重视,并且已成为当今生物认证技术领域中的一个研究热点。本文在研究当前说话人识别中常用的特征参数提取算法的基础之上,提出了基于MFCC提取的改进算法和基于Gammatone滤波器组的听觉特征提取算法,并在MATLAB平台下进行了仿真实验。本文主要工作如下:1、本文首先对说话人识别技术的工作原理、系统结构与性能评价准则等相关知识进行了详细的阐述。分析了目前常用的话者特征参数提取,重点研究了LPC、LPCC和MFCC特征参数的提取算法,同时也对基于高斯混合模型的说话人识别系统进行了深入研究。2、提出了一种基于MFCC特征提取的改进算法。详细分析了MFCC和IMFCC各自的优缺点,并针对MFCC提取算法中所采用的Mel三角形滤波器组在高频区域的计算精度不足,而IMFCC提取算法中所采用的翻转Mel三角滤波器组在低频区域的计算精度不足,提出了将Mel三角滤波器组的低频区域与翻转Mel三角滤波器组的高频区域相组合的改进型滤波器组,然后在MFCC提取算法中用改进的滤波器组代替传统的Mel三角滤波器组,进而得到一种改进的特征参数NewMFCC。此外,还将NewMFCC与频谱质心特征进行组合,提取了它们的组合特征参数。最后在TIMIT语音库上进行仿真实验,证明了改进算法的有效性。3、提出了一种基于Gammatone滤波器组的听觉特征提取算法。分析了人耳听觉系统的组成与工作原理,深入研究了Gammatone滤波器组和听觉系统的非线性特性。在新的听觉特征提取算法中采用Gammatone滤波器组代替传统的Mel三角形滤波器组,用与频率相关的指数压缩代替固定的对数压缩,然后结合升半正弦倒谱提升技术,得到了一种新的听觉倒谱系数GFCC。最后通过仿真实验,比较分析了GFCC的性能,结果表明:与LPCC和MFCC相比,GFCC具有更好的识别率和噪声鲁棒性。
其他文献
有色彩缤纷的3D画面,充满搞笑和具有未来感的人物造型,还有许多需要花心思的游乐园经营理念,是一套老少皆宜、娱乐和益智兼备的好游戏。
关于蒙古舞蹈概述莫德格玛蒙古舞蹈是以“伯依勒格”为标志、“德布色勒特”节奏为基础、曲线造型为特征、圆韵动律为变化、乐韵为灵魂的人体旋律美的艺术。蒙古舞蹈文化,在宗
慈善事业是构建和谐社会的重要基础。企业慈善捐赠是慈善事业的重要资金来源。企业承担社会责任成为构建和谐社会的重要内容之一。在我国,由于特定的社会、经济、政治环境,战
<正> 一、什么是古今词义对照教学法古今词义对照教学法,是指在进行汉语教学时,为了让学生掌握某一词(或语素)的意义,将该词(或语素)的文言词义和现代语素义结合起来进行理解
我国是一个人口大国,人口与资源的矛盾一直存在。水资源是人类日常生活的必须品,其利用是否合理直接关乎到我国国民经济的正常发展。就目前我国的现状来看,经济在快速的发展,
车架是电动三轮车的主要承载部件。目前,电动三轮车车架的设计依然主要依靠传统设计经验和路试来完成。由于这种做法的局限性,加之车架是一个大型的受力构件,在无法预测车架
恢复性司法作为一项刑事司法革新运动,在英美法系国家,正在被广泛适用。恢复性司法着眼于对被破坏的社会关系的恢复,因而有利于实现法律效果和社会效果的统一。缓刑制度在我
以大学精神引领高等远程教育校园文化可以增强师生的归属感、认同感;促进远程教育院校的内涵式发展;增强远程教育院校的品牌优势;提升远程教育院校的核心竞争力。本文通过对