基于RISC-V的神经网络卷积算法的研究与优化

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:gaolch009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为加速嵌入式平台ARM CMSIS-NN上的神经网络卷积算法,提出一种面向开源RISC-V(精简指令级架构第五代)的卷积算法.采用RISC-V的P拓展指令集中特有的8位数据操作指令,优化ARM CMSIS-NN(微处理器软件接口标准)库中因为缺少DSP指令8位数据操作指令而带来的内存使用效率不高的不足.经实验仿真和下板验证,在蜂鸟E203 FPGA开发板上以16 MHz的时钟频率完成功能验证,与同等实验室实验情况下的arm-cortex-m3等设备相比,性能提升约12倍.
其他文献
针对云计算下基于属性访问控制策略容易被第三方修改造成资源被恶意访问的情况和现有策略检索方法效率低的问题,提出基于默克尔-帕特里夏树(MPT)和布隆过滤器(Bloom Filter)的属性访问控制策略管理方法.为访问控制策略集合构建一棵MPT树,通过PDP进行验证的方式监督策略是否被修改,把策略集合通过Hash函数映射到Bloom Fil-ter,通过对访问控制请求进行hash运算来完成策略检索过程.理论分析和实验结果表明,该方法能在策略被篡改时以改变根hash的方式导致PDP验证失败,提高策略的安全性,与
在建设工程中,常用的构件为混凝土结构,由于混凝土构件的主要病害问题为裂纹,对房屋工程质量有一定的影响.文章对建筑施工中混凝土裂纹的主要分类加以分析,并研究其形成的主要因素,给出具体的质量控制措施以供参考.
为有效解决不可感知性、鲁棒性和有效载荷的权衡问题,以及水印信息的高安全性问题,提出一种基于秘密共享和平稳小波变换(SWT)的音频水印算法.利用Shamir的秘密共享方案对水印信息处理得到n份秘密信息,其中n-1份安全存储在区块链中,剩余一份嵌入在根据水印信息特征产生出的哈希码选定的浊音帧中.在频域内,通过SWT和Schur分解(SD)修正浊音帧的离散余弦变换(DCT)系数,将水印自适应地嵌入到从SD获得的正交矩阵的第一列元素中.实验结果表明,该算法具有较高的不可感知性,在低通滤波、重采样、重量化、MP3压
为解决已有病毒检测机制无法很好地处理大量未知病毒及深度网络模型难以部署在嵌入式设备上应用的问题,提出一种基于轻量级深度网络的计算机病毒检测方法.采用B2M算法将病毒映射为灰度图像,提取灰度共生矩阵GLCM作为轻量级深度网络SqueezeNet的输入,将传统视觉特征与深度神经网络进行整合,实现病毒的高准确率判别.对SqueezeNet进行卷积结构和特征增强的改进,使之运行速度更快、资源消耗更低,检测精度更高.实验验证了该方法的有效性.
房建工程招标阶段的造价控制除了与企业效益有关,也直接影响工程建设质量.文章通过分析招标阶段造价控制的必要性,从严审施工图纸、工程量清单招投标、招标文件编写、合同审查、EPC及模拟清单等方面给出了有效的造价控制方案.
针对目前使用消息队列遥测传输(message queuing telemetry transport,MQTT)协议进行遥测数据传输时容易出现多节点通道数据重复,以及移动传输中节点通道连接不稳定等问题,提出一种基于WebSocket的MQTT协议(MQTT over WebSocket)数据传输方法.通过设置身份标识去重算法与数据格式匹配算法,构建数据传输模型,解决传输过程中可能出现的冗杂重复、数据丢包问题.使用该方法,辅以支持北斗导航的硬件设备开发一套车辆信息管理系统.测试报告表明,系统使用该方法实现了
针对云南边远山区低网络覆盖率和低传输速率下普通移动设备对神经网络处理速度慢、成本高、效率低的问题,提出一种基于APSoC的心音辅助诊断算法的硬件加速方法.在对5122例心音信号进行去噪、特征提取等预处理后,训练CNN网络模型用于心音样本分类.设计通用卷积电路与通用池化电路,将HLS优化后生成硬件电路部署至Zynq-7020 APSoC硬件平台,实现CNN算法的硬件加速.实验结果表明,相同条件下,其分类速度相比Intel-i7-8700提高了35倍,分类准确率仅损失了不到1%.该方法满足了高性能、低功耗、低
生成适应网络利用对抗训练辅助模型进行域适应分类,但仅使用单源域学到的知识有限,且对抗训练不足以减少域差异,造成判别特征难以识别,影响分类精度.针对该问题,提出一种结合对抗网络与条件均值的多源适应分类方法(MSDACG).对多个源域进行特征提取,提升特征学习的有效部分,对不同源和目标域特征使用特定域的生成对抗网络及条件最大均值差异拉近域间距离,采用差异损失约束由不同源域训练的分类器,实现利用多个源域的监督信息对目标域样本进行分类.实验结果表明,MSDACG模型能学到更优的域不变特征,与目前多源域适应算法比较
为提高编码程序对网络吞吐量和网络延迟的增益,在机会网络编码的基础上,利用自适应处理进行升级,提出一种机会网络编码扩展算法.该扩展算法作为通信栈中的一个独立层,仅依赖于节点本身的信息.在分组编码模块,编码算法搜索编码机会,寻找将消息附加到传出分组的机会;在决策制定过程中,根据网络链路质量的变化自动调整容限角;在自适应处理观察编码过程,采用与编码相关的参数.实验结果表明,与面向传输优化的机会网络编码(ONC-TO)、基于聚类的网络编码方法(CNC),以及不使用网络编码方法相比,所提编码程序能够显著提升网络有效
针对传统的同时定位与建图(SLAM)算法在动态环境中会降低自身运动估计的精确性以及系统鲁棒性的问题,提出一种适用于动态环境的视觉惯性SLAM算法——DVI-SLAM(dynamic visual inertial SLAM).根据对极几何约束检测并去掉动态特征,利用更加精确的静态特征进行状态估计;添加视觉信息自适应权重因子,提高系统的鲁棒性.改进的SLAM算法在公开的视觉惯性数据集TUM-VI上进行相关实验,实验结果与VINS-MONO相比在高动态场景中的定位精度平均提高了47.34%.