基于矢量量化和高斯混合模型的说话人识别技术研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:wangyang2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是生物识别的一个分支,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文就小规模文本无关说话人识别的理论和技术进行了系统的研究。分别在语音库建立、语音去噪、端点检测、特征提取及识别方法等5个方面取得了较有成效的进展。建立了一个基于说话人识别的小型语音库,完成了20个人的语音样本采集工作,为算法测试奠定了物质基础。针对基于软阈值的多尺度小波去噪方法对清音的功率谱破坏较大,不利于保持语音完整性的缺点,提出了分段小波去噪方法,较完整的保留了清音的功率谱,同时充分利用了基于软阈值的多尺度小波去噪方法的去噪能力。对分形维数在端点检测中的应用进行了研究,研究表明和短时能量、短时过零率相比,分形维数具有更好的鲁棒性,适用于低信噪比环境。比较和分析了现有说话人识别特征,表明梅尔倒谱系数在单独使用时优势明显,梅尔倒谱系数及其二阶差分系数的组合具有更好的区分能力。提出了一种基于语音频谱的准基音频率,该特征依赖于浊音的谱特性,和基音频率相比具有较好的抗噪声、抗长时变动的能力。在不改变空间复杂度,不明显增加时间复杂度的前提下,利用语音无精确类别的特性,将粗糙集引入矢量量化中,降低了噪声的干扰能力。利用各语音段被噪声干扰的程度不同,提出了一种自适应补偿的高斯混合模型法,在一定信噪比范围内提高了系统的识别性能。本文用MATLAB建立了文本无关说话人识别的实验平台,实验结果表明改进算法的整体性能要优于传统算法,其中采用分形端点检测,小波去噪,MFCC特征和基于粗糙集的矢量量化方法的性能较好,在20dB信噪比下,识别率可达到98.03%。
其他文献
微机械加速度计作为一种重要的惯性器件,在汽车、消费电子、惯性制导等方面有广泛的应用前景。本文介绍了低噪声和高速全差分运算放大器的设计基本原理,另外针对本实验室的闭环加速度计系统结构,设计了其内部的运算放大器,即电荷放大器,后级放大器,单位增益缓冲器。作为全差分微加速度计检测电路的电荷放大器,必须进行低噪声设计。本文设计的低噪声全差分放大器的等效输入噪声在10.55nV/ Hz左右。而随着数据传输速
牟山镇位于宁波的西大门,区域面积38.5平方下米,辖7个行政村、1个小区,现有常住人口19539人.2019年该镇始终把生活垃圾分类工作作为践行绿色发展理念和推进精致生态宜居牟山
期刊
我国是世界上最大的纺织品贸易国,但是作为支撑纺织业的纺织设备生产行业,由于在我国起步较晚,目前与国际领先的纺织设备生产商之间还有一定的差距。技术装备落后影响了我国纺织
网络嗅探和分析技术是很多网络安全软件实现的基础,也是设计网络分析软件的基础,现有的一些技术如防火墙、协议分析等软件的实现都是以数据包的嗅探捕获为前提的,所以研究相关的
圆籽荷Apterosperma oblata H.T.Chang是中国特有濒危的山茶科植物,分布于广东鹅凰嶂自然保护区。《中国珍稀濒危保护植物名录》中被列为珍稀二级保护植物,2004世界自然保护联
虽然目前我国经济在短期内享受了大宗商品价格持续下跌带来的红利,但本轮下跌行情对经济的不利影响也日益明显。近期,各主要经济体为克服大宗商品价格下跌的不利影响业采取了
苦荞作为一种药食同源的作物,具有很好的营养价值和保健作用。但是有报道苦荞可能引起过敏症状,如哮喘、皮炎等,而苦荞种子中的储藏蛋白被鉴定为苦荞主要过敏原。该蛋白属于C
人机交互是目前最炙手可热的话题之一,手势识别作为一种重要的人机交互方式在智能手机上已经得到了广泛的应用,如完成解锁的手势密码和手机触屏游戏等等,然而这种接触式的识别限
本研究的目的是开发一种新型的可以使植物来源抗菌剂(香芹酚)在动物消化道内定点的包被技术,同时能使定点释放的植物抗菌剂发挥其生物活性功能。并且本研究通过一些列动物实验验
本文通过对荣华二采区10
期刊