基于Xilinx Zynq的说话人识别的研究与设计

被引量 : 4次 | 上传用户:gaoyeye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着嵌入式系统和说话人识别技术的发展,基于嵌入式的说话人识别系统已经广泛应用在医疗服务、银行证券、公安司法等领域。近年来,随着移动互联网的发展,使用手机、平板电脑等手持设备实现异地身份验证,语音信号可能是表征用户身份的首选特征参数,掀起了一股说话人识别研究的新热潮。本文设计了基于Xilinx Zynq的与文本无关的说话人识别系统,为后续基于移动设备的开发应用奠定基础。本文的主要工作如下:首先,介绍了语音信号的采样量化、预处理和特征参数提取方法。详细阐述了预处理的关键技术:预加重、分帧加窗以及端点检测;详细介绍了特征提取方法MFCC。其次,介绍了高斯混合模型(GMM)的基本原理。具体介绍了运用高斯混合模型进行参数训练的期望最大化(EM)算法,参数训练初始化的k-means算法。阐述了说话人识别系统训练和识别的原理,并使用Matlab进行了仿真实验。再次,本文以Xilinx Zynq为硬件平台,构建了嵌入式与文本无关的说话人识别系统。通过介绍Xilinx Zynq硬件资源,将系统的软件架构分成两部分:PC机辅助软件及嵌入式识别软件,两者通过NFS文件系统进行文件共享。PC机辅助软件主要用于GMM模型参数的训练和识别算法的验证。考虑到FFT计算单元的复杂性,设计了Real FFT硬件加速模块。为包含有Real FFT硬件逻辑的硬件平台搭建了嵌入式环境,这包括添加解析配置文件的u-boot新命令并修改u-boot源码使其支持多系统引导、修改设备树源文件对Flash进行分区、制作根文件系统并将其编译至Linux内核中。然后设计了硬件逻辑的软件接口。最后,对说话人识别系统进行了测试,分析了系统的识别率以及系统响应的实时性,并阐述了对将来工作的展望。
其他文献
近年来,国内文献对中国卫生医疗改革的研究有一个显著特点:几乎都把中国政府卫生投入规模"不足"问题,作为造成目前卫生医疗改革困境的主要原因之一。但是,伴随着公共健康政策
综述了相变储能材料在建筑中的应用与发展现状,包括相变储能材料的特性、分类及其与建筑材料的融合技术,重点介绍了固—固相变材料与建筑材料的融合技术,最后介绍了相变储能
离心风机以其压力系数大、工作效率高、尺寸小以及拆装方便等特点,被广泛地应用在国民经济的各个领域和日常生活的诸多方面。随着科技的进步,人们对离心风机的性能要求越来越
汉语桥世界大学生中文比赛在十三年的岁月里,逐渐成为中国文化向外展示魅力的媒介。在符号学视野下,结合文献研究方法和案例分析法,借助符号互动理论的相关知识,对其文化传播
伴随着电子商务的迅猛发展,最近几年物流业也发展迅速。但是长久以来,物流公司的管理成本却居高不下。如何整合网络资源和信息技术,提升物流管理工作的效率和准确度、节省开
运用相似系数等方法分别对长三角制造业产业层次、行业层次和产品层次的区际分工状况进行测度,可以得到江苏、浙江和上海在制造业领域的协作正逐步增强,地区专业化分工已初步
动画电影,是指以电影的形式呈现,时长在90分钟到140分钟之间的动画叙事片,是电影的一种类型。音乐对于电影的影响同样作用与动画电影。但是,由于动画电影在在主要人物以及画
侦察雷达接收机应具备尽可能宽的瞬时接收带宽以截获所需的各类有用信号,具备大的瞬时动态范围以在同时获得的多强信号之间的交调失真或者高密度脉冲下的混叠脉冲中依旧正常
有源频率选择表面天线罩继承了FSS天线罩的优点,又可以通过人为调控实现带内隐身,能够更加适应未来信息战争,是天线罩发展的必然趋势。本文基于几何光学法和CATIA建模软件设
本文利用金融危机前后中国制造业企业调查数据,考察了企业对劳动力成本冲击和金融危机造成的需求冲击的反应。根据劳动力需求函数,估计结果表明,制造业企业的劳动力需求产出