面向关键词识别系统的低功耗语音活动检测模块的设计

来源 :东南大学 | 被引量 : 0次 | 上传用户:xiaohai_wl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音活动检测是一项用于区分语音和非语音的语音分类技术。语音活动检测常常被用作关键词识别系统/语音识别系统的开关,因此语音活动检测的识别率对于后级系统的正常运行至关重要;与此同时,语音活动检测模块越来越多地被用在依赖电池供电的物联网和可穿戴设备上,并且始终处于工作状态(always-on),因此降低语音活动检测功耗的需求愈发强烈。为此,本文设计了一种低功耗语音活动检测模块,通过从算法、电路两方面去优化设计,使其兼具高识别率与低功耗。本文从算法和电路两方面进行低功耗设计。首先对低功耗语音活动检测所使用的神经网络算法进行了压缩,以降低其计算资源和存储资源消耗。通过二值化和量化对神经网络的数据和权重的位宽进行压缩,得到一个应用于高信噪比环境的二值神经网络(Binarized Neural Network,BNN)和一个适用于低信噪比环境的二值权重网络(Binarized Weight Network,BWN)。其次,本文对低功耗语音活动检测的算法模型进行电路设计:1.根据分类算法的需要,提出了环境噪声监测算法。增加模拟特征提取的第17个通道,其输出经过计算得到环境噪声监测值。基于对环境噪声监测值的判断,对电路的工作模式进行选择,包括低功耗模式(BNN开启)和高性能模式(BWN开启)。2.根据BNN和BWN的特点分别设计了计算单元(Process element,PE),并使用近似化方法简化了偏置、批量归一化、激活电路,降低计算功耗。3.提出了精度自适应或门近似加法单元,并应用于BWN计算单元中,在保证计算精度的同时,单个加法单元功耗降低30%。本文采用TSMC 22nm ULL工艺进行验证。本文提出的低功耗语音活动检测在10dB噪声下识别率为94%,功耗为0.508μW;在-5dB噪声下识别率为91.43%,功耗为0.578μW。除此之外,本文额外提出了增强型语音活动检测,其支持一个唤醒词检测,在10dB噪声下识别率超过90%,功耗为0.881μW。
其他文献
研究目的随着社会经济的快速发展和生活方式的不断改变,糖尿病的患病率不断上升,已成为继心脑血管疾病(Cardiocerebrovascular Disease,CVD)、恶性肿瘤之后,又一严重威胁居民健康和社会发展的慢性非传染性疾病。通过对江苏省社区管理的2型糖尿病(Type 2 diabetes mellitus,T2DM)患者进行前瞻性随访,分析肥胖指标、血糖控制水平与T2DM患者全死因及重点疾
城市快速道路是城市道路交通系统的重要组成部分,对保证城市内车辆通行的快速、便捷起着重要作用。因此,提高快速路车辆通行效率可以大大提高城市的交通网络系统运行效率。由于快速路匝道车辆的汇入与主线通行车辆产生大量交织,引发合流区的交通流紊乱,主线交通流自由换道现象大量增加,车辆运行速度降低,路段通行效率大大下降。基于以上现象,本文利用车辆时空轨迹数据,以快速路合流区的自由换道行为为主要研究目标,分析合流
互联网的不断发展促进了视频网站的繁荣。越来越多的人喜欢在视频网站上自主地选择自己喜欢的节目观看。体育视频由于其竞技性、娱乐性、受众广等特点在网络视频版图中占据重要的一块。但相比于电影、电视剧等类型的视频,体育视频,尤其是策略型体育视频,往往因其专业性而有较高的观看门槛。很显然,利用自然语言处理技术为体育视频自动地生成赛事解说,不仅可以为普通用户提供专业帮助,增添视频观看乐趣,而且可以为体育视频网站
广义逆理论的研究主要涉及复矩阵、Banach(Hilbert)空间上的有界线性算子、环上矩阵及范畴中态射.经典的广义逆如Moore-Penrose逆和Drazin逆(群逆)在微分方程、数值分析、控制理论等众多领域发挥着重要的作用.近年来,随着广义逆理论的发展,人们引入了核逆、伪核逆、广义(伪)Drazin逆和*-DMP元.本文基于复Hilbert空间上的有界线性算子和复Banach代数,研究其上的
木质纤维素类生物质热解炭化制备炭材料是最具前景的研究方向之一。目前高品质的生物炭主要以椰壳、竹子等特殊生物质为原料,采用廉价、大宗秸秆制备高品质的生物炭是未来发展的趋势。但秸秆种类繁多,何种秸秆适合制备何种性能的碳材料,如何针对性进行品质提升,实现最优化匹配目前研究较少。基于此,本文建立了 6类大宗农业废弃物制备的生物炭和典型污染物吸附特性之间的映射关系,针对优选的原料进行改性优化匹配研究,揭示相
随着微纳光子学的发展,对光电器件进行微区光电性能表征是提升现有光电器件性能及发展下一代光电器件的必由之路。光电流扫描显微技术是光伏器件和光探测器件的微区光电表征的有效手段,已经用于多种器件的微观机理研究及性能提升工作。然而,光电流扫描显微技术难以区分结构光学和电学方面分别的贡献。为了实现对结构光学和电学影响进行区分和定量研究,本文设计并搭建了微区光电流测量系统,以砷化镓太阳能电池为例,通过单波长的
目的:分析早期胃癌(EGC)经内镜黏膜下剥离术(ESD)切除的预后及其影响因素,为EGC内镜治疗适应证的可行性及预后判断提供依据。方法:回顾性收集2014年4月至2019年3月在东南大学附属中大医院行ESD治疗的病例,纳入符合内镜治疗适应证的147例EGC病例。以同期予相同治疗的71例胃高级别上皮内瘤变(HGIN)的病例作为对照,比较两组的整块切除率、完全切除率及并发症发生率。分析ESD治疗EGC
背景:脑白质疏松症是一组由影像学描述的临床综合征,是脑小血管病的主要分型之一。越来越多的研究证实,脑白质疏松症与认知功能障碍关系密切,但其影响认知功能的确切机制仍不清楚。目的:本研究利用静息态脑功能磁共振成像技术,分析脑白质疏松症(leukoaraiosis,LA)患者静息态脑功能改变的特点,探讨LA患者认知功能损害的潜在影像学机制。方法:本研究共纳入研究对象80人,其中LA组40人,健康对照组4
目的:探究2型糖尿病患者体成分改变与胰岛功能的关系。方法:选取2018年8月至2019年3月在东南大学附属中大医院内分泌科住院治疗的2型糖尿病患者200例,其中男性122例,女性78例。行OGTT联合C肽释放试验,收集患者空腹血糖(FPG)及空腹C肽(FC-P),用C肽改良的稳态模型HOMA公式计算患者胰岛素抵抗指数(HOMA-IR)以及胰岛功能指数(HOMA-β)。并根据BMI水平将受试者分成非
沥青混合料均衡设计是近年来为应对沥青路面复杂多变使用要求而提出的新型设计方法。该设计方法主要通过混合料密实度与紧密度的平衡来实现,具体通过空隙率、矿料间隙率、饱和度等宏观参数进行控制;但这些参数难以反应混合料内部矿料的分布与接触状态等细观特征。已有研究表明,混合料内部矿料的分布与接触状态等细观特征是反应混合料紧密度的重要参数,它们对混合料的性能有着重要的影响。因此,有必要从细观角度阐释沥青混合料的