基于FPGA的说话人识别系统设计与实现

来源 :武汉理工大学 | 被引量 : 5次 | 上传用户:luxinyiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是根据说话人语音中包含的个性特征来完成对说话人身份的辨认或者确认。说话人识别因其特有的优势受到了人们的广泛关注,经过多年的研究与探讨,已经出现了很多比较成熟的说话人识别系统。FPGA因其并行处理结构,处理速度块,能满足市场对系统实时性的要求,此外,FPGA采用sram工艺,可以无限编写程序,有利于系统的升级与维护。故本文实现的说话人识别系统采用FPGA作为实现平台。本文首先在深入研究说话人识别理论基础上,设计了一个适合在FPGA上实现的说话人识别系统,并采用Matlab对所设计的基于VQ的说话人识别系统进行了仿真与验证。然后采用各种逻辑设计技巧,完成了说话人识别系统的各个FPGA功能模块的设计,同时分别采用Modelsim仿真工具验证其功能。论文主要研究内容如下:(1)分析了课题研究的目的与意义,讨论了说话人识别发展与研究现状,阐述了目前主要的语音特征参数与说话人识别算法。(2)针对FPGA结构,选取了易于在FPGA上实现的基于VQ的说话人识别模型,阐述了各个说话人识别系统的组成模块,并针对传统的VQ说话人识别系统,增加了语音增强处理,并将VQ失真测度改为加权距离测度。采用Matlab软件,训练生成说话人识别模型库,并采用测试语音分析系统说话人识别效果。(3)分析了FPGA工作原理,阐述了Xilinx公司的FPGA开发套件ISE Design Suite10.1,并简单的说明了说话人识别系统的FPGA硬件平台XUP Virtex-II Pro开发板进行了,为说话人识别系统的FPGA实现提供了硬件准备。(4)依据自上而下的模块设计准则,设计了基于FPGA说话人识别系统的各个功能子模块,包括预加重模块、分帧加窗模块、端点检测模块、语音增强模块、MFCC特征矢量提取模块、VQ模块和判决模块。并且,针对设计的各个功能子模块,采用Modelsim仿真工具,对它们进行了功能仿真与逻辑验证。(5)设计了控制模块,使各个系统功能子模块协调工作实现了说话人识别系统,并通过RS232串口将识别结果上传到PC机上,通过超级终端显示出来。使用Modelsim对整个说话人系统进行了FPGA功能仿真验证与结果分析。
其他文献
海面目标检测因受到海杂波的影响,传统目标检测方法易产生高虚警问题,如何有效抑制非平稳的、相关性强的海杂波,提高海面目标的检测能力,一直是雷达检测领域的难点问题。在高
现代信息技术的迅猛发展,使得人们对信息需求量越来越大,而传统的信号压缩和重建遵循香农-耐奎斯特采样定律,即采样率必须至少为信号最高频率的两倍,才能保证在重建时不产生
由于人们收集的个人数据呈指数速度增长,图像和视频的数据量也随之增加。相比于文本的方式,现在人们广泛采用文本附带图像或视频的方式记录生活。但是,由于图像或视频数据量较大,在各种社交软件上上传图像与视频时,人们无法快速准确地寻找到感兴趣的图像或视频片段。针对上述需求,本文提出了一种基于视频描述模型的跨模态视频日记检索方法,通过分析视频内容自动生成自然语言描述,实现了视频与文本的跨模态转换,帮助人们在庞
学位
近几年,随着云计算和物联网等技术迅速发展,结合我国制造业目前存在的高能低效,利用工业资源不合理等问题,将这些前沿的信息理论运用在制造业中,提出了云制造(Cloud Manufact
本文以区域经济比较优势理论为基础,对河北地区的经济发展形势以及创新人才培养策略进行分析和探讨,旨在通过创新人才培养提高当地经济发展水平.
被动雷达是使用空间环境中已有的军用或民用设备发射的信号而自身不发射信号的雷达系统。被动雷达系统通常由监督通道和参考通道两部分构成,监督通道用来接收目标反射信号,参
近年来,随着软实时技术的快速发展,以多媒体为主导的便携式设备,如:智能手机、平板电脑、itouch等,在人们的生活中越来越变得重要。而各种新功能的需求以及芯片的发展,对以电
近年来,嵌入式视频监控的广泛普及对社会各行各业的安全防范起到了不可或缺的作用。随着对监控需求的增加,有线嵌入式监控系统布控范围受到局限,不能满足特殊监控场合的弊病
随着互联网的兴起与日益激增的数据处理需求,云计算以其低廉的成本,强大的运算存储能力与高可靠性等众多优良特性逐渐受到各大IT企业的重视。MapReduce是云架构的编程模型,用以
图像配准是对取自不同时间、不同传感器或不同视角的同一场景中的两幅或多幅图像匹配的过程。它被广泛的应用于计算机视觉、模式识别、遥感图像处理、医学图像处理等诸多领域