说话人识别算法研究及SOPC设计

来源 :重庆大学 | 被引量 : 0次 | 上传用户：zc81065442

【摘要】

：

说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。凭借其独特的经济性、准确性和方便性等优势,

【作者】

：

顾彦飞

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2010年期

【关键词】

：

说话人识别 SOPC MFCC VQ算法 GMM算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

说话人识别技术属于生物认证技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。凭借其独特的经济性、准确性和方便性等优势,说话人识别技术已广泛应用于通信、公安、金融、司法及其它民用安全认证领域。本文围绕文本无关的说话人识别系统展开研究工作。在对语音预处理、说话人特征提取和识别算法深入研究和实验验证的基础上,设计了一套切实可行的系统小型化架构方案;结合Nios II嵌入式处理器和FPGA自身特点,对整个算法进行了合理的选择与优化,设计了基于SOPC的文本无关的开集说话人识别系统。论文的主要研究内容包括以下几个方面:1.研究了基于高斯统计模型的VAD算法,并针对语音中的噪声存在性以及DD参数估计算法的帧延迟特性,构建了基于TSNR估计方法的子频带加权VAD算法,提高了高斯统计模型VAD算法的鲁棒性。实验表明,此子频带加权算法优于Sohn、Cho以及G.729B等全频带算法。2.研究了常见的说话人特征提取以及识别算法,重点分析和验证了MFCC类和声源类特征参数以及基于VQ和GMM算法的二级识别结构对说话人识别系统的影响。实验表明,采用MFCC及其差分系数、帧对数能量和Renyi熵构成的混合特征参数,能够充分刻画说话人的声道和声源特征,使说话人识别系统达到最佳的识别性能;MFCC与帧对数能量构成的混合特征参数占用空间及识别时间最少,系统识别性能较好,最适合嵌入式系统实现;二级识别算法在保证或优于GMM识别算法精度的同时,降低了系统实现的计算复杂度。3.在基于SOPC的设计平台上,采用MFCC与帧对数能量混合特征参数以及基于VQ和GMM的二级识别算法,构建了完整的开集说话人识别系统以及良好的人机交互接口,实现了语音的实时采集与处理、用户键盘注册与系统输出显示等功能,并通过实际测试验证了说话人识别系统工作的可靠性。系统实验结果表明,本文所设计的系统整体方案有效可行,基于SOPC的说话人识别系统在速度、精度、可扩展性等方面具有独特的优势,是说话人识别系统小型化的一种切实可行的解决方案,具有良好的发展空间。

其他文献

EPON系统QinQ协议一致性测试研究

网络技术的迅速发展及网上新业务的不断涌现，使得人们对网络带宽接入的需求不断增加。于是，出现了不同的宽带接入技术。而光纤接入以其频带宽、传输距离远、传输质量高等众多优

学位

EPON系统QinQ协议一致性测试

用交变引力场实现编码通信系统设计和理论分析

电磁场是目前可以实现越过真空进行编码通信的唯一载体，如果可以实现利用引力场进行编码通信，就为人类找到了第二种可承载信息越过真空的载体，无论是在基础理论还足实践方面它都

学位

交变引力场编码通信频率调制传播速度理论分析

协作通信中的能效分析与优化

由于无线频谱资源的限制以及爆发式增长的用户对容量的需求,传统无线网络追求的目标是高频谱效率。然而网络获得的高频谱效率常常是以牺牲能耗为代价获得的,这不仅带来了高增

学位

能量效率绿色通信协作通信译码转发OFDM

基于TDT的超宽带无线通信系统同步技术研究

超宽带(UWB,Ultra-Wideband Radio)作为扩频技术的一类,由于具有高数据率、高带宽、低功耗、抗多径能力强、安全性好以及成本低廉等诸多优点而受到社会各界的关注。它既可用

学位

超宽带(UWB)同步TDT算法Hermite脉冲

新疆利用外资优化产业结构

摘要：随着世界经济一体化进程的不断加深，产业结构优化已成为提高一国竞争力的重要途径。在我国经济发展的大环境下,新疆面临相同的情况。近几年,虽然新疆利用外资总额不断增长,但所吸引的外资金额在全国外商直接投资额中所占比例较低。对于位于西部地区的经济相对落后并且待开发的新疆而言，利用外资尤其是外商直接投资无疑具有更大的现实意义。如何更好的利用外资，发挥外资对新疆经济的推动作用,引导外资的流入结构,优化和

期刊

新疆外商投资产业结构优化

南宁市城乡一体化联合图书馆调查研究

文章在对南宁市城乡一体化联合图书馆建设做基础调查的基础上,对建设过程中出现的主要问题进行了归纳并阐述了相关解决措施.

期刊

联合图书馆图书馆联合城乡一体化

基于FIC8120的视频监控系统设计与实现

基于模拟信号的监控系统逐渐淡出了人们的视线,数字视频信号的传输随着Internet的发展触及世界的各个角落,让视频监控真正的实现了“远程”。ARM、DSP、FPGA等SOC技术的成熟,

学位

视频监控系统FIC8120RTP/RTCP丢包率MPEG-4

协同分集及其在MIMO-OFDM系统中的应用

在MIMO-OFDM系统，比如两发一收的空时格码一正交频分复用(Space-Time trellis code-Orthogonal Frequency Division Multiplexing，STBC-OFDM)系统，空频块码—正交频分复用(Space

学位

MIMO-OFDM系统协同通信协同MIMO-OFDM系统功率分配

基于内容图像检索的乳腺肿块诊断技术研究

乳腺癌是危害妇女健康的最常见的疾病,钼靶X线摄影是目前临床上乳腺疾病检测的主要手段,但是,乳腺肿块大多被埋没在复杂的,高密度的腺体背景中难以检出和识别。因此,利用计算

学位

乳腺X线图像基于内容图像检索计算机辅助诊断互信息

大数据背景下的图书馆管理探讨

大数据将当前互联网技术带入了“Web 3.0”时代,它是继“云平台计算”技术之后的又一次革命性技术变革,它丰富了人们获取信息的方式途径,也进一步扩大了信息的传播量.在大数

期刊

大数据图书馆数据平台管理建设

说话人识别算法研究及SOPC设计

其他学术论文