【摘 要】
:
针对软件和硬件实现方式各自的优点及不足,提出了遗传算法的软硬件协同设计方法,并且将这种方法在FPGA上进行了具体的实现.首先对遗传算法流程中的各个模块进行了详细的分析,根据软硬件的不同特点以及设计实现的目标,对遗传算法的功能模块进行了软硬件划分,然后对硬件实现的部分进行了详细的介绍,包括模块之间的连接,模块的内部状态机,模块的端口,所有硬件模块的功能仿真.同时,为了保证软硬件之间的正常通讯,提出了一种新的软硬件交互通讯协议.最后将硬件实现部分做成通用IP核,方便其他设计者使用,并给出了软硬件协同的遗传算法
【机 构】
:
智能机器人湖北省重点实验室,湖北 武汉 430205;武汉工程大学 计算机科学与工程学院,湖北 武汉 430205;武汉工程大学 计算机科学与工程学院,湖北 武汉 430205;华为技术有限公司,广东
论文部分内容阅读
针对软件和硬件实现方式各自的优点及不足,提出了遗传算法的软硬件协同设计方法,并且将这种方法在FPGA上进行了具体的实现.首先对遗传算法流程中的各个模块进行了详细的分析,根据软硬件的不同特点以及设计实现的目标,对遗传算法的功能模块进行了软硬件划分,然后对硬件实现的部分进行了详细的介绍,包括模块之间的连接,模块的内部状态机,模块的端口,所有硬件模块的功能仿真.同时,为了保证软硬件之间的正常通讯,提出了一种新的软硬件交互通讯协议.最后将硬件实现部分做成通用IP核,方便其他设计者使用,并给出了软硬件协同的遗传算法在二进制问题和0-1背包问题两个实例中的具体应用数据.通过与纯软件实现方式的实验数据进行比较,提升了算法运行时间50%的效率,且算法的收敛性保持一致,进一步验证了该算法的适用性及高效性.
其他文献
由于移动终端计算能力和内存大小的限制,在移动设备上进行实时目标检测具有非常大的挑战性。为了更好地在无人驾驶汽车等移动设备上进行目标检测,该文以YOLOv3单阶段目标检测模型为基础,对部署在移动设备上的目标检测模型进行优化,以提高模型的检测精度(MAP)并降低计算复杂度。具体改进措施为:基于DarkNet-53为主干网络引入组卷积和通道洗牌技术;基于M. G. Hluchyj等学者提出的网络设计指导
随着无人机技术在生产生活中的广泛应用,由其引起的公共安全、隐私保护等问题也日渐突出,因此基于计算机视觉的无人机检测技术逐渐成为当下的研究热点。目前,常用的深度学习目标检测方法如Faster-RCNN、Yolo等在通用的目标检测领域已经可以获得良好的检测性能。但是在无人机检测任务上,由于目标小、边缘设备算力低等限制因素,常用的目标检测算法无法有效地应对这些难题。对此,文中基于轻量级无人机检测网络TI
板式换热器板片型号多达上百种,每种型号的材质与结构也不尽相同,对不同亮暗不同纹理的区域进行定位,使用固定阈值的边缘检测方法难以保障检测结果。针对此问题,提出一种基于Canny的自适应板式换热器板片边缘检测方法。该方法根据不同型号的波纹板自动调整边缘检测参数,其中包括标准差、高低阈值,使其与所处理的波纹结构相适应,以达到最佳的边缘定位效果。通过数学模型推导出标准差与边缘宽度以及高低阈值与边缘高度之间
针对常见的视频目标跟踪算法难以适应背景杂波、形变和遮挡等干扰场景,提出了一种基于孪生网络的多级串联注意特征融合目标跟踪算法。该算法并不是简单将不同层的特征进行加权融合,而是从深层到浅层多级地进行注意特征的融合,并引入模板更新机制。将首帧图像和当前搜索帧的前一帧图像作为跟踪模板,用MobileNetV2网络提取目标模板帧图像和当前帧图像的深层语义特征和浅层位置特征;提取的特征进入多级串联特征融合注意
随着国内机动车保有量的持续增长,城市道路交通运转压力急剧增强。在现有交通管理系统中,通常采用图像处理算法检测机动车违章行为。但基于图像处理算法的违章检测系统存在计算量大、不适用于嵌入式设备和复杂场景下检测精度下降等问题,为系统在实际中的应用带来了一定的限制。针对该问题,将深度学习算法引入检测系统中,提出了基于MobileNet_SSD的路口交通违章检测系统。以MobileNet_SSD网络检测车辆
图像作为信息的主要载体,人们可从图像中获取更多后期决策的依据。由于获取图像的条件不同,导致在进行多幅图像融合时采取的方法不尽相同。如何从同一场景的不同图像中获取更为丰富的信息成为图像融合的关键问题。首先,对各种类型的图像融合进行总结得出图像融合的具体概念。其次,概述图像融合的经典理论及方法,根据处理对象将融合方法分为基于变换域的方法和基于空间域的方法并对其进行对比分析。接着,分析表征融合图像质量的
图像到图像翻译是一类视觉和图形问题,其目标是使用一组图像来学习输入图像和输出图像之间的映射。近年来关于图像到图像翻译任务的研究工作有很多,例如pix2pix和CycleGAN都在这个任务上表现得非常优秀。但是很少有研究工作是关于如何对这类图像到图像翻译模型进行压缩,降低参数量的使用。目前轻量级网络结构的设计更多是用于基于卷积神经网络的目标检测模型和分类模型,而用于生成对抗网络模型的轻量级网络结构的
卷积神经网络是一种前馈神经网络,它的人工神经元可以响应部分覆盖范围内的临近单元,对于大型图像处理有出色表现.文中设计了一种基于Zynq芯片的CNN加速器,以期在资源和功耗受限的FPGA中实现运算性能加速.该加速器采用数据量化的方式将网络参数从64位双精度浮点数转化为16位定点数;针对CNN不同层的特性和要求,设计了不同的网络结构和优化策略.卷积层和全连接层采用循环分块、循环流水及循环展开等方法进一步改进,而池化层采用流水线的优化方式.亦设计了FPGA和外部存储器的缓存策略,减少FPGA和外部存储器的数据传
人工智能技术广泛应用于自动驾驶、无人机、机器人等自主无人系统,是实现场景感知、情报获取、辅助决策等复杂功能的重要支撑.因此,研究人工智能技术的脆弱性和本身安全性问题引起了越来越多的关注.对抗机器学习(adversarial machine learning)是机器学习和计算机安全领域的交叉学科,是人工智能算法普遍面临的挑战之一.文中以实际场景下的人工智能安全性为出发点,梳理了对抗样本发展的起源,形成的机理以及发展脉络.首先从攻击、防御两个方面探究各种方法的原理和优缺点;其次,在分析研究经典算法和适用场景的
人脸识别系统经常会受到光照环境的影响。为了提高低照度条件下的人脸识别性能,提出了一种基于循环生成对抗网络的低照度人脸图像增强方法,利用循环生成对抗网络将低照度条件下的人脸图像转换成正常光照下的人脸图像。模型包含生成器和判别器,生成器由包含4个卷积层、9个残差网络层和2个转置卷积层的卷积神经网络组成,判别器由包含5个卷积层的卷积神经网络组成。在循环生成对抗网络训练的过程中,采用改进的损失函数,并结合