神经网络在基带信号处理中的应用及其高效实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:hytsxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未来无线网络超高的速率给基带信号处理芯片的设计与实现提出了巨大的挑战,基带芯片不仅需要能够处理多种算法,还需要能够提供极高的吞吐率,然而电子信息设备小型化、低功耗的发展趋势意味着未来的基带芯片需要兼具小面积和低功耗的特性。在摩尔定律放缓的大背景下,这些挑战使得基带芯片的设计与制造难上加难。此外已有的无线基带算法中还面临最优检测与估计、无法建模和难以求解以及缺乏算法与硬件实现联合优化等问题。本文立足于以上问题,对神经网络算法在多个基带算法中的应用进行了深入探究。此外,本文还针对经过神经网络优化的算法,进行算法与硬件的协同优化,提出了高效的专用硬件架构,并在ASIC平台上进行了实现和性能验证。
  首先,针对第五代移动通信(5G)系统中的极化码译码,本文提出了深度学习(DL)方法,以优化极化码BP译码和级联的Polar-LDPC码联合译码这两种译码算法。首先,本文提出了二维偏移最小和(2-D OMS)译码算法,以提升现有归一化最小和(NMS)译码的纠错性能。然后,本文利用DL中优化神经网络的方法用来优化和搜索所提出算法中的参数。数值结果表明,在各种码长度上,所提出的2-D OMS与精确BP译码算法之间几乎没有纠错性能上的差距。本文还针对级联的Polar-LDPC码,提出了低复杂度的级联OMS算法,结果显示经过DL算法优化后的级联OMS算法在码长为1024的极化码上,取得了与L=2的CRC辅助的串行抵消列表(CA-SCL)译码算法接近的纠错性能。
  上述的优化方法被扩展应用到大规模MIMO系统,深度神经网络(DNN)被用于增强基于消息传递算法的MIMO检测器(MPD)。本文首先介绍了通过展开迭代的MPD算法来构建用于MIMO检测的DNN架构的通用方法。然后结合改进的MPD(包括阻尼置信传播(BP),最大和(MS)BP和简化的CHEMP算法,提出了多种DNN MIMO检测器。所提出的DNN MIMO检查其中未知的校正因子通过深度学习方法进行优化,以达到更好的性能。实验结果表明,与最小均方误差(MMSE),BP和CHEMP等多种最新的MIMO检测算法相比,本文提出的DNN MIMO检测器只需要训练一次,即可重复用于多次检测,而且在保证复杂度相近的前提下,可以实现更好的误码率性能,增加对各种天线和信道条件的鲁棒性。
  基于神经网络方法,本文还研究了非线性信道上的均衡问题。文章提出了一种基于神经网络的联合均衡与译码器,无需信道状态信息(CSI)即可实现对接收信号的盲均衡和译码过程。与已有的方法不同,本文使用了两个分离的神经网络。首先,使用一个卷积神经网络(CNN)从具有码间干扰和非线性失真的接收信号中,自适应地恢复出传输信号。然后,一个深度神经网络译码器(NND)对来自CNN均衡器的检测信号结果进行译码。在多种信道条件下,实验结果表明,所提出的CNN均衡器比其他基于机器 学习的方法具有更好的均衡性能。与最先进的神经网络模型相比,所提出的模型减少了约2/3的参数量。此外,该模型可以轻松地以O(n)的复杂度拓展到任意长度的序列。
  针对低复杂度的硬件实现,本文对极化码译码和神经网络的推理等各种任务提出了多种量化方案和优化策略,主要贡献在于三个方面:(a)本文提出一种确定极化码BP译码器的定点量化方案和最佳LLR缩放因子的方法,为相应的硬件设计提供了理论指导。(b)此外,针对高效CNN推理,本文提出了一种低比特且无需重新训练的量化方法,该方法可使CNN仅用移位和加法运算处理推理运算。实验结果表明,与其他低比特的量化方法相比,该方法无需在ImageNet上进行重新训练即可达到更高的精度。而与全精度模型相比,所提出的算法取得了5至8倍的压缩比,而硬件实现所需的资源大量减少,同时还保持了系统吞吐量。(c)为了设计和优化通信系统中的神经网络模型,我们提出了一个经过重新训练的迭代优化框架,以找到不同神经网络的高效量化方案。此外,本文提出了卷积神经网络的高效设计方法,在不损失性能的前提下减少了所需的参数和计算复杂度。在调制分类、信道译码器和均衡器任务上,与全精度模型相比,量化并优化后的NN模型仅需4到5位的权重比特和8比特的激活值即可达到与全精度模型相当的性能。优化后模型的大小被显著压缩,推理的硬件复杂度也大大降低。
  除了算法的优化外,本文还重点研究了极化码BP译码器和神经网络推理的高效能和可重配置的硬件体系结构。首先,本文提出了可配置的极化码OMS译码器的ASIC硬件架构。该译码器架构可重新配置,以支持三种极化码码长(N =256, 512, 1024)和两种译码模式(2-D OMS和级联OMS)。在65 nm CMOS工艺上实现的极化码OMS译码器对于码长为1024的最大译码吞吐率为5.4 Gb/s,对于码长为256的最大译码吞吐率为7.5 Gb/s,与目前其他最新的极化码BP译码器性能相当。此外,在码长度为1024的级联OMS译码模式下可实现5.1 Gb/s的吞吐量,延迟为200 ns,这优于具有相近纠错性能的CA-SCL(L=2)译码器。
  现有的研究利用Winograd和快速傅里叶变换(FFT)等快速算法来减少CNN的卷积运算复杂度,本文针对CNN和生成对抗网络(GAN)模型提出了一种基于ASIC的可重构且低复杂度的加速器,旨在进一步加速CNN中的卷积(CONV)以及GAN中的转置卷积(TCONV)计算。首先,利用费马数变换(FNT),我们提出了两种基于FNT的快速算法,分别降低了CONV和TCONV计算的复杂度。然后给出了基于FNT的加速器的硬件体系结构,以实现所提出的快速算法。还介绍了确定硬件设计参数和优化数据流的方法,以获取最高的性能和效率。此外,我们在65 nm 1P9M工艺上实现了所提出的加速器,并在多种CNN和GAN模型上对其进行了评估和测试。布局布线的后仿真结果表明,我们的设计在VGG-16上实现了288.0 GOP/s的吞吐率以及25.11 GOP/s/mm2的硬件面积效率,优于最新的CNN加速器。此外,在GAN上至少比现有的加速器快1.7倍,并且其能源效率分别是CPU和GPU的275.3倍和12.5倍。
其他文献
人乳头瘤病毒(Human Papillomavirus,HPVs)是一种引起人类皮肤、粘膜的乳头状瘤或疣,且可导致恶生病变的病原体.其中,人乳头瘤病毒16型(HPV16)是引起宫颈癌的主要因素,但目前尚缺乏有效的预防手段.由于该病毒尚不能体外培养,减毒活疫苗灭活疫苗的制备几乎不可能实现,且蛋白疫苗有一定局限性.目前,人们比较倾向于核酸疫苗,在动物实验中已经证实HPV16晚期基因L1的产物具有诱导产
学位
QR码是一种用于承载信息的二维图像,因其便捷高效、安全性高且使用成本低等特点,已被广泛应用于电子名片、网上支付、公共交通等多个领域。随着QR码应用场合的增加,人们对识别QR码的终端设备的需求也变得更多样。传统的QR码识别设备通常基于纯软件的形式实现,由于QR码识别算法数据运算量大且处理器串行执行的特点,使得用户不得不在设备的成本和性能之间做出平衡。  因为硬件电路能够并行处理且成本低的特点,针对高
电阻抗肌动描记术(Electrical Impedance Myography, EIM)是哈佛医学院SewardB.Rutkove教授提出的一种基于肌肉电阻抗测量与建模分析的神经肌肉疾病诊断新方法,具有无辐射、非侵入、操作简单、低成本等优点,在神经肌肉疾病的早期发现与诊断、长期监测、治疗以及药物研制等方面具有潜在的应用前景。  然而,现有的EIM技术无法同时满足快速性与准确性的要求。首先,基于5
偶极子天线有大带宽,高增益,方向图稳定等良好的辐射特性,所以在无线通信领域得到广泛的应用。尽管偶极子天线的提出已有一个世纪之久,但对它的研究依然经久不衰,很多新的偶极子天线被提出。近年来,利用方向图互补原理以获得稳定辐射特性成为偶极子天线研究的一个热点,主要方法有三种:1.磁电偶极子天线,将电偶极子和磁偶极子结合在一个天线单元里面,以实现两个极化平面内方向图的互补;2.交叉偶极子天线,将两个电偶子
通过交流和直流反应溅射,我们以硅基片(表面上有白金加热电极)为基底制作HS气敏元件.实验表明,纳米WO和纳米SnO对HS都具有敏感.但是,在元件的灵敏度和响应/恢复时间上,SnO元件比WO无件优越.在一个相对较长的时期内,两种元件的稳定性都较差,其灵敏度随着环境温度和湿度的变化而变化.在后续的研究中,我们应该对环境温度和相对湿度的影响多加研究.提出了灵敏度随时间变化的方程.从元件的性能测试中可以看
学位
栅介质是CMOS器件的核心部分,也是目前限制CMOS器件Scaling down的主要因素之一.不同于传统的SiO栅介质,该文采用SiN/SiO叠层膜作为栅介质,并成功的应用于深亚微米CMOS器件中.该文的主要研究工作包括以下内容:(1)在国内首次成功的制备出等效氧化层厚度(EOT)为21A的超薄SiN/SiO(N/O)叠层栅介质膜.(2)详细研究了N/O叠层栅介质膜的特性.C-V分析结果表明,N
学位
近年来,随着智能手机和移动互联网业务的高速发展,LBS在人们的生活、娱乐以及安全等领域的作用越来越明显。然而在5G技术与场景下,复杂多变的城市环境对移动终端定位的实时准确性提出了更多挑战。指纹定位方法能有效利用无线传播的多径特性实现高精度定位,其与诸如 5G 大规模 MIMO 技术相结合的应用前景更加宽阔,目前就两者结合的方法和技术研究仍在不断深入开展中。本文就大规模MIMO 单站场景下基于机器学
学位
毫米波通信、大规模多天线系统、超密集组网等新技术是第五代(5G, 5th Generation)移动通信系统的关键性支撑技术。这些新技术要求5G无线接入网络实时、准确地获取用户终端的位置信息。通过对上行链路参考信号进行测量直接获取用户终端位置信息的方式可以满足这个要求。因此,上行链路参考信号在5G移动通信系统,特别是移动性管理问题中具有广泛的应用空间。本文主要研究上行链路参考信号在5G移动通信系统
学位
分布式计算是处理具有海量数据与超大规模计算问题的重要解决方案,随着分布式计算系统规模的逐渐增大,将会不可避免的遇到掉队问题与通信负载过大的问题。本文从编码的角度切入分布式计算,研究其中的掉队问题以及通信优化问题,并为相关的具体应用提供解决方案。  首先,论文对分布式计算中的掉队问题,通信优化问题以及相关应用采用的主要编码方法进行介绍。然后具体针对分布式计算中的掉队问题,我们以分布式矩阵向量相乘,分
随着人类文明的发展和生产生活范围的扩大,人类对于更广范围的通信、更及时的连接、更深层次的感知等需求加速了第六代移动通信(6G)的研究进展。对关键性技术变革的争论正是6G概念讨论的核心问题之一,其中涉及的关键方向有智能通信技术,即将人工智能应用于通信的技术。以AI为内核的智能连接将会是赋能6G愿景的关键所在。本文面向智能通信中的先进收发机设计展开研究。  首先,研究了消息传递算法及深度学习在无线物理
学位