面向高噪声场景的低功耗关键词识别特征提取模块设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:aman25826882
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的语音识别应用进入到大家的日常生活中,其中关键词识别是语音识别应用领域必不可少的关键技术之一,而这些应用设备对低功耗和噪声场景下的识别精度要求很严苛,因此本文将提出一种面向高噪声场景的低功耗关键词识别特征提取的专用集成电路模块。本文主要从算法、电路两方面去优化设计,尽可能在保证识别精度的情况下降低关键词识别特征提取的功耗,主要工作包括:(1)基于传统梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)特征提取算法设计了精简矩形梅尔频率倒谱系数(Simple Rectangular Mel Frequency Cepstrum Coefficient,SRMFCC)特征提取算法架构,相比传统的MFCC,本文的工作在不同信噪比的噪声场景中都能保持良好的识别精度。(2)实现了不同信噪比噪声的模式切换设计和其中快速傅里叶变换(Fast Fourier Transform,FFT)模块乘法计算的多阶量化共享乘法器可适应不同的计算精度要求,与标准乘法计算相比,可显著降低功耗。本文基于TSMC 22nm工艺,完成了面向高噪声场景的低功耗关键词识别特征提取模块的设计,实验结果表明,本文SRMFCC算法使总体数据量减少50%,相比传统特征提取算法MFCC,SRMFCC的乘法计算量降低了77.8%。本文验证系统是二值化权重网络(Binarized Weight Network,BWN),布局布线后的总面积是0.72mm2,其中特征提取的面积为0.195mm2,工作主频率为250k Hz,延时为12ms,低功耗模式下功耗为2.81u W、高精度模式下功耗为5.32u W,相比主流设计方案,功耗降低了74%,在信噪比为-5dB的时候识别准确率达到91.3%,信噪比5dB时识别精度为95.47%。
其他文献
随着大数据时代的到来,计算机硬件能力正不断提升,数据信息的获取也越来越便捷。计算机视觉、自然语言处理和语音识别等技术不断进步,人工智能领域的各种应用也逐渐走进人们的生活。随着人工智能的核心技术——深度学习技术的不断发展,基于深度学习的目标检测和跟踪技术成为计算机视觉领域的热门课题,并广泛应用于智能监控系统和互联网移动端。其中,对于视频的目标检测与跟踪算法一直都是研究的难点和热点,也具有极其重要的科
随着装配式建筑体系的推进和发展,预制墙板配套砂浆得到了广泛的推广和应用,但现有的砂浆存在易开裂、收缩大和粘结性能低等一系列问题。本文针对装配式构件连接用材料的无收缩、高抗裂、高韧性等需求,研究水胶比、聚灰比、粉煤灰、固体养护剂和纤维对粘结砂浆性能的影响。结果表明,提高聚灰比和粉煤灰掺量可以有效降低砂浆的收缩,提高抗裂能力。降低水胶比和提高聚灰比可以提高砂浆的粘结性能,但会降低砂浆稠度。适量的固体养
在多式联运业务流程中,单证系统起着联结各多式联运参与方的重要作用。区块链作为近年来较为火热的研究方向,在信息系统构建与业务流程优化方面有巨大的探索空间。基于上述背景,论文探索使用区块链工具优化现有多式联运单证业务流程及基于区块链的多式联运单证系统的实现细节。首先,探索使用区块链工具对现有单证流程进行优化。通过基于现有单证业务流程和使用区块链工具优化后的业务流程分别建模,得到区块链技术在现有单证业务
第一部分TNFAIP3在人和大鼠正常及退变椎间盘髓核组织中的表达变化目的明确TNFAIP3及NF-κB通路相关信号分子在正常和退变椎间盘髓核组织中的表达变化。方法搜集临床人正常与退变髓核组织并采用免疫组化法观察正常和退变髓核组织中TNFAIP3表达变化;利用针刺法构建SD大鼠IVDD模型,分别提取正常与退变髓核组织的m RNA和蛋白(4周、20周、20周穿刺退变、50周),采用实时定量聚合酶链反应
目的:躯体症状障碍(somatic symptom disorder,SSD)是以一种或多种突出的令人痛苦的躯体症状为主要特点,同时伴与躯体症状或健康相关的不恰当的感受、想法或行为的一种精神障碍。SSD患者花费过多的时间、精力关注躯体症状而严重影响了日常生活和社会功能。本研究探讨SSD患者大脑白质(white matter,WM)结构和功能连接(functional connectivity,FC
飞行器如无人机(Unmanned Aerial Vehicle,UAV)等在生产生活中的广泛应用,让自主飞行控制变成飞行器领域的核心技术和重难点问题。如何设计实现高效优质的自主飞行控制系统成为新一代智慧飞行器设计制造的关键问题之一。目前大部分飞行控制研究关注的是低延时下的人为控制;或者是编制好任务路径以硬编码的方式让飞行器按照规划好的路径前进以完成任务。这两类飞行器控制技术均不能脱离人的控制和规划
由于具备体积小,价格实惠和控制稳定的优点,多旋翼无人机近十年来被逐渐广泛应用在各个领域,亦被广泛研究。其中基于单目视觉的无人机障碍规避是众多研究问题中有挑战性的问题之一,该研究对机载传感器要求低,且对于无人机小型化智能化,多传感器融合与灾备有重要意义。同时,在深度估计研究中所提出的自监督深度估计方法大幅度降低了构建数据集并训练对应场景下深度估计模型的难度,这使得基于单目深度估计的无人机避障具有高可
基于知识图谱的问答系统(KBQA)应用越来越广,用户提出的问题也更加复杂,通常包含多个查询意图,需要进行逻辑,定量,比较等聚合型的推理运算。语义解析方法是一种实用的方法,旨在将复杂的自然语言查询转换为机器可执行的逻辑形式(logic form,LF),再通过模块化的符号执行得到最终答案。训练语义解析模型通常需要大量专家标注的“黄金(gold)”逻辑形式。但是在实际应用中,获得这种逻辑标注的成本很高
背景:在过去十年中,埃博拉病毒病(Ebola Virus Disease,EVD)在非洲反复暴发,包括2014-2016年在西非的暴发以及2018-2020年在刚果民主共和国的暴发。这些暴发导致了不同的病死率和其他社会经济影响。尽管如此,关于该病的风险和影响的文献报道却很少,特别是孕妇和儿童等特定弱势群体的相关报道更是如此。目的:本研究旨在通过文献计量学量化并可视化2010-2019年期间发表的埃
粘胶纤维是再生纤维素纤维的一种,属于生物质纤维范围,是循环经济可持续发展的重要化学纤维产品。近年来国内粘胶行业产能快速增长,同行间竞争加剧,加之政府环保政策逐年收紧,如何提升传统产品的竞争力,加快高新产品的研发,是每个国内粘胶企业所面临的问题。FBE公司主营化学纤维制品生产和销售,整理车间负责将饼丝加工成筒丝,并进行分级、包装、入库工作,其生产管理能力的高低直接影响到公司产品质量的好坏,进而影响公