论文部分内容阅读
随着嵌入式系统和说话人识别技术的发展,基于嵌入式的说话人识别系统已经广泛应用在医疗服务、银行证券、公安司法等领域。近年来,随着移动互联网的发展,使用手机、平板电脑等手持设备实现异地身份验证,语音信号可能是表征用户身份的首选特征参数,掀起了一股说话人识别研究的新热潮。本文设计了基于Xilinx Zynq的与文本无关的说话人识别系统,为后续基于移动设备的开发应用奠定基础。本文的主要工作如下:首先,介绍了语音信号的采样量化、预处理和特征参数提取方法。详细阐述了预处理的关键技术:预加重、分帧加窗以及端点检测;详细介绍了特征提取方法MFCC。其次,介绍了高斯混合模型(GMM)的基本原理。具体介绍了运用高斯混合模型进行参数训练的期望最大化(EM)算法,参数训练初始化的k-means算法。阐述了说话人识别系统训练和识别的原理,并使用Matlab进行了仿真实验。再次,本文以Xilinx Zynq为硬件平台,构建了嵌入式与文本无关的说话人识别系统。通过介绍Xilinx Zynq硬件资源,将系统的软件架构分成两部分:PC机辅助软件及嵌入式识别软件,两者通过NFS文件系统进行文件共享。PC机辅助软件主要用于GMM模型参数的训练和识别算法的验证。考虑到FFT计算单元的复杂性,设计了Real FFT硬件加速模块。为包含有Real FFT硬件逻辑的硬件平台搭建了嵌入式环境,这包括添加解析配置文件的u-boot新命令并修改u-boot源码使其支持多系统引导、修改设备树源文件对Flash进行分区、制作根文件系统并将其编译至Linux内核中。然后设计了硬件逻辑的软件接口。最后,对说话人识别系统进行了测试,分析了系统的识别率以及系统响应的实时性,并阐述了对将来工作的展望。