与文本无关说话人识别技术的研究

来源 :东北林业大学 | 被引量 : 0次 | 上传用户：l907603912

【摘要】

：

说话人识别技术在近年来已成为既有巨大吸引力而又有相当难度的研究热点。说话人识别(Speaker Recognition)是从说话人发出的语音信号中自动提取说话人信息,并对说话人进行识

【作者】

：

李健

【机构】

：

东北林业大学

【出处】

：

东北林业大学

【发表日期】

：

2009年期

【关键词】

：

说话人识别预处理特征提取 LPCC MFCC

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别技术在近年来已成为既有巨大吸引力而又有相当难度的研究热点。说话人识别(Speaker Recognition)是从说话人发出的语音信号中自动提取说话人信息,并对说话人进行识别的研究。它有别于语音识别,其目的不是识别说话的内容,而是对说话人的身份确定,即系统对说话者是谁而做出判断的研究。本文主要为与文本无关的说话人识别系统的研究。主要的研究工作:对于已建立的语音库中样本进行预处理,其中包括对语音样本进行预加重、分帧、加窗、端点检测等语音信号处理工作。其中重点研究双门限端点检测的方法,并完成了其程序的设计到算法实现。经过预处理工作,减少了数据量,一定程度上降低噪声干扰,为后续工作的实现和分析打下良好的基础。研究了传统的线性预测系数(LPC)、线性预测倒谱系数(LPCC)、Mel频率倒谱系数(MFCC)的特征提取办法及线性预测Mel频率倒谱系数(LPMCC)和MFCC、MFCC的一阶差分、二阶差分结合短时帧能量构成(3Q+1)维特征参数的两种改进算法。实验求取特征参数,通过可分性测度D值分析,初步评价比较这五种的特征提取办法。数据显示改进后的特征参数较传统的特征参数有较高的D值,更有利于识别。应用隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)四种识别方法,对特征参数进行识别,构建说话人识别系统。通过实验研究,进一步证实改进后的特征参数在系统识别率上明显优越于传统的特征参数。并比较分析四种识别方法,其中人工神经网络(ANN)和支持向量机(SVM)的在识别效果上要比传统的隐马尔可夫(HMM)和矢量量化(VQ)更好。

其他文献

离子束辅助沉积制备非晶合金薄膜及其性能

该文尝试采用离子束辅助沉积技术(IBAD)制备二元金属系统非晶合金薄膜.该技术是在电子束蒸镀薄膜的同时用离子束轰击薄膜,使两种不同的金属材料在远离平衡的过程中被混合并形

学位

离子束辅助沉积非晶合金薄膜非晶形成范围电阻温度特性

灌溉渠道流量与水量调控技术研究

学位

水资源评价和管理中水文水利参数时空变异性研究

学位

简易量水坎在U型渠道上应用的初步研究

学位

Fe<,3>Al/Al<,2>O<,3>复合材料的制备与组织性能研究