【摘 要】
:
不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方面,提出了新的通道剪枝标准,结合了通道的相关性和影响性以及输出通道对应的激活值,在保证精度的同时可以极大地削减卷积神经网络的计算量和参数量;在编译工具链方面,设计了一套自动的端
论文部分内容阅读
不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方面,提出了新的通道剪枝标准,结合了通道的相关性和影响性以及输出通道对应的激活值,在保证精度的同时可以极大地削减卷积神经网络的计算量和参数量;在编译工具链方面,设计了一套自动的端到端优化堆栈,提出了针对基于现场可编程门阵列(FPGA)的深度学习编译器设计方法,并在中间表示中添加了所
其他文献
深度生成模型结合了生成模型与多层神经网络,在计算机视觉、目标检测、自然语言处理等领域得到广泛应用.变分自编码是一种重要的深度生成模型,通过多层神经网络对生成模型和后验概率分布的近似分布进行建模,得到目标函数的变分下界.变分自编码以其显式的生成模型建模方式及定量的下界表示形式受到研究者的关注.由于变分自编码中推理模型的表示能力有限,使得生成的图像精细度不高.本文提出一种基于对抗性策略的变分自编码模型
针对Dropout的流动性和随机性可能引起欠拟合或过拟合的问题,提出跨信道计算注意力权重并掩盖注意力权重最大区域的正则化方法(MARDrop)。首先,设计跨信道注意力权重提取机制,提取所有特征图的注意力权重,并筛选出注意力权重较大的部分作为特征判别单元。然后,根据特征判别单元周围区域的注意力权重变化确定出注意力权重最大区域,并将其掩盖即置对应区域为0,其余区域均置为1。最后,将取值为1的注意力权重
针对超高清产业中高分辨率资源较为匮乏的问题,视频超分辨率是一项很有实用价值的工作。为了有效利用视频序列帧间丰富的时间相关性信息及空间信息,提出一种基于多尺度时域3D卷积的视频超分辨率重建算法。该算法将输入的低分辨率视频序列帧分别通过不同时间尺度的3D卷积进行时空特征提取,3D卷积由于其3维卷积的特性相较于2D卷积更加适用于视频任务的处理,通过不同尺度时域下提取的两种时空特征自适应运动补偿后,由亚像
锆石是各种岩石中常见的副矿物,不仅是最佳的定年矿物,且其微量元素、同位素还记录岩石形成演化过程的大量信息.关于地幔橄榄岩等超基性岩中出现锆石的报道越来越多,但通常认为超基性岩SiO_2不饱和,不太可能结晶锆石,导致其成因和来源常受质疑.本文通过热力学相平衡模拟,计算不同条件下岩石的SiO_2活度与锆石/斜锆石转变条件,以探讨SiO_2活度的受控因素、锆石/斜锆石在超基性-基性岩特别是地幔橄榄岩中的
以我国北方地区天津武清、山西晋中、辽宁沈阳和内蒙古乌兰察布等地的典型设施菜地土壤为研究对象,分析设施蔬菜种植过程中土壤稀土元素的变化特征,尝试利用稀土元素特征值示踪、表征人类活动对土壤生态环境干扰的可行性。结果发现,辽宁沈阳设施菜地表层土壤中稀土元素总量(REE)范围为146.52~158.76mg·kg~(-1),均值为152.34 mg·kg~(-1);天津武清区设施菜地表层土壤中稀土元素总量
紫外波段是星系能谱分布中的重要部分.其包含大量原子、离子和分子的共振线以及研究重要物理过程的连续辐射,提供了理论研究重要的观测限制.在星系研究中,紫外辐射追踪大质量恒星,是测量和理解宇宙中恒星形成历史的重要工具.紫外辐射也可追踪大质量黑洞吸积盘,是理解吸积物理过程的重要手段.其涉及的关键科学问题包括宇宙正午时期的恒星形成历史与星系演化、宇宙重子物质缺失、宇宙再电离能量来源以及星系吸积和外流反馈等.
运动视频中特定运动帧的获取是运动智能化教学实现的重要环节,为了得到视频中的特定运动帧以便进一步地对视频进行分析,利用姿态估计和聚类的相关知识,提出了一种对运动视频提取特定运动帧的方法。首先选用HRNet姿态估计模型作为基础,该模型精度高但模型规模过大,为了实际运用的需求,对该模型进行轻量化处理并与DARK数据编码相结合,提出了Small-HRNet网络模型,在基本保持精度不变的情况下参数量减少了8
属性值约简是粗糙集理论的核心问题之一,也是数据挖掘和知识发现领域中,基于专家系统构建规则提取算法与归纳规则分类器的重要技术基础。针对现有属性值约简模型程序复杂,难以实现,并且所提取的关键信息往往过于追求简明,而削弱决策系统表达能力这一问题,提出一种基于确定性因子的启发式属性值约简模型。首先,构造几种不同性质的属性集工具,并给出其相关定理及证明,同时开发一种约简信息函数,实现为约简属性赋值;然后,将
针对深度强化学习算法在复杂动态环境中训练时,由于环境的部分可观测性原因导致智能体难以获得有用信息而不能学习到良好策略且算法收敛速度慢等典型问题,提出一种基于LSTM和非对称actor-critic网络的改进DDPG算法。该算法在actor-critic网络结构中引入LSTM结构,通过记忆推理来学习部分可观测马尔可夫状态中的隐藏状态,同时在actor网络只使用RGB图像作为部分可观测输入的情况下,c
钠离子电池因其资源丰富、环境友好等优点成为最有可能代替锂离子电池的新一代储能体系.然而,具有高容量、长循环稳定性的负极材料的缺失成为阻碍钠离子电池发展的关键.金属硒化物具有理论容量高、安全性好以及形貌容易设计等优点,已经逐渐成为新一代钠离子电池负极的潜在替代材料.然而,金属硒化物本征电导率低,导致其循环稳定性较差,一般需要通过形貌设计或掺杂、复合等方式进行改善.本文介绍了近年来多种金属硒化物在钠离