基于DSP的说话人识别算法的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:lifang877
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据说话人的发音特性自动识别说话人的过程,它不注重包含在语音信号中的语义内容信息,而是着眼于包含在语音信号中的个人发音特征,从语音中提取说话人的这些个人发音特征,用以识别说话人。随着计算机与语音的交互技术日趋成熟,说话人识别技术在许多领域内都发挥出了重要的作用,如安全和军事领域、通信领域,财经领域等。对说话人识别技术的研究可以结合DSP(Digital Signal Processor,数字信号处理器)来进行。当前DSP芯片已经在数字信号处理中被广泛应用,它具有灵活便携的特点并且有出色的数字化计算能力,因此,在DSP上实现说话人识别系统成为一个很重要的研究方向。   本文主要对基于DSP的说话人识别算法进行研究。论文首先结合对说话人识别系统的研究工作,对系统中的重点知识做了详细介绍和分析。从说话人语音信号的基本知识开始,逐步介绍了说话人识别系统中的预处理、特征参数提取、参数训练以及识别等工作。其中选择Mel频率倒谱参数(Mel-frequency Cepstral Coefficients,MFCC)作为说话人的特征参数,选择高斯混合模型(Gaussian Mixture Model,GMM)作为系统的参数模型。其次对GMM模型的训练和识别算法进行了优化,提出了基于DSP的在线训练和识别算法,该算法可以大幅度节省存储空间、降低计算复杂度,并有效地减少等待时间。   在理论介绍的基础上,本文建立了一个应用在线算法的仿真说话人识别系统,并对该系统中的各个模块进行了较为详细的介绍。文章最后对系统进行了测试,测试工作主要集中在对在线算法性能的验证和对一些系统参数取值的测定上。测试结果表明本文提出在线算法具有很好的性能,不仅系统识别率高,并且对存储资源的需求也较低,充分满足了在DSP上的应用需求。
其他文献
学位
在机器学习中,间隔常用来度量分类器的置信度。其中支持向量机中的最大间隔算法因具有强壮的理论保证并在实际应用中展现出优异的性能而成为机器学习领域的一个研究热点。双
随着4G/LTE(4 Generation/Long Term Evolution)网络的迅速发展与部署以及无线移动网络性能的进一步提升,互联网中的用户数和应用都出现爆炸性增长。在网络带宽提高的同时数
随着网络音频文件的广泛传播,以及信息安全领域面临的严峻形势,音频隐写技术已经受到越来越多的关注。本文在分析总结音频隐写技术当前的研究现状与存在的问题后,主要围绕在
迎合“大数据”、“智能机器”双时代的来临,“智慧政府”、“智慧城市”已经在国内被提上日程,并在部分先进地区已经开始应用,“智慧公安”也开始初见倪端,并在部分地区被提
HSUPA(高速上行分组接入技术)是继HSDPA(高速下行分组接入技术)之后,WCDMA系统又一个新的发展历程,该技术采用了HARQ重传机制,更短的TTI等关键技术,使得上行速率最高达到5.76
图像超分辨率重建是一种由低分辨率(LR)图像获得高分辨率(HR)图像的技术,其目的是恢复图像在降质过程中损失的高频信息和细节信息。其主要方法包括基于插值、基于重建、基于
近年来,政府稽察部门加大了对政府投资建设项目的监管力度,稽察的方式方法不断创新,稽察手段的信息化水平日益提升.本文对建立政府投资项目监管系统应用的重要性、主要内容和
蓝牙通信技术,现在已经是非常成熟的短距离数据传输技术.在蓝牙系统中,为了支持不同应用,需要使用多个协议,这些协议按层次组合在一起,构成了蓝牙协议栈.蓝牙协议栈是蓝牙技
智能天线技术是第三代移动通信系统的关键技术之一,近年来受到了广泛关注,成为国内外的研究热点。随着近年来移动用户数量的剧增和新型移动业务类型(语音、数据、图像等)的出现