【摘 要】
:
排序作为基本的计算问题,广泛应用于多种场景,如数据库、机器学习等,传统通用处理器实现的排序算法受限于cache与内存速度差异,性能提升有限,越来越多场景采用FPGA进行硬件加
【机 构】
:
上海大学特种光纤与光接入网重点实验室 上海200444
论文部分内容阅读
排序作为基本的计算问题,广泛应用于多种场景,如数据库、机器学习等,传统通用处理器实现的排序算法受限于cache与内存速度差异,性能提升有限,越来越多场景采用FPGA进行硬件加速.随着机器学习、人工智能等新兴技术的出现,需要处理的数据量呈指数增长,基于FPGA实现大数据量排序的排序器通常为合并排序器,合并排序器能够以迭代的方式实现大数据量排序,而现有基于FPGA实现的合并排序器不支持变长合并排序,在实际应用中仍有巨大挑战.针对现有的合并排序器的问题,提出了一种基于FPGA的高性能变长合并排序加速器,该排序结构通过对基本合并树添加控制逻辑的方式实现变长合并排序.为了使得该排序结构能够实现任意长度的大数据量排序,提出了一种新颖的数据存储结构以及读取控制方法,实现了变长合并树输入队列有序.为了验证提出的加速器的正确性以及评估加速器性能,在开发板KCU1500上实现了该结构,当排序70M个双精度浮点类型数据时,相比软件排序,提出的排序加速器性能是软件排序的6倍.
其他文献
Au-Au热压键合工艺在微电子器件的制造与封装中有着广泛的应用.为了提高晶片键合质量,保证器件的稳定性和工作期限.在工艺试验过程中,首先利用超声波湿法清洗方法和氧等离子
热模锻压力机在锻造行业领域中主要应用于航空、汽车、内燃机、船舶、拖拉机、石油机械、矿山机械以及五金工具等行业的大批量黑色及有色金属锻压当中,具备高生产效率、便捷操作、自动化以及便于维修的特点。热模锻压力机的设计采用上下顶料的模式,减小了拔模斜度,提高了导轨精度,在确保锻件质量的同时也能够有效降低锻材的浪费。热模锻压力机的打击速度较快,极大地降低了模具的热接触时间,能够延长模具寿命。
通常在公共数据集上训练的目标检测器,将它们应用于新的场景时,一般会面临很大的困难。如图片风格、光照、物体形状、背景的不同,使得测试数据和训练数据存在较大的跨域偏移问题,若想取得大量的带标签的图片进行再训练不太现实。基于图像级分类正则化模块和调整区域层次上对齐模型,提出域对抗领域自适应方法,利用图像级分类正则化提高对关键目标的特征提取能力,同时降低不可迁移信息的激活。在实例级别通过调整区域层次上的对
针对当前医护人员专业技能和经验的差异性、传统医疗设备携带不便等问题,设计一种基于树莓派的心肺复苏医疗信息物理融合系统(MCPS).树莓派作为系统控制器连接各种医疗传感器
语音识别技术和红外遥控技术的结合近年来逐渐得到业界的重视.针对智能家居的特定需求,以对家用空调的控制为例研究采用语音识别来实现对家用电器进行红外遥控的方法并实现具
通过工艺参数智能监控管理系统来实时监控对工件有直接或间接影响的相关工艺参数,对冲压工艺运行状态进行判断与分析,进而通过控制工艺参数来提高产品质量.通过与现场总控PLC
为解决风电功率序列随机性强、波动性大、预测误差高的问题,提出一种基于集合经验模态分解与卷积神经网络-极端梯度提升相结合的短期风电功率组合预测模型.该模型首先对原始
在实际应用中,一般要求磁耦合谐振式无线电能传输(MCR-WPT)系统能维持恒定的输出电压,现有输出电压控制方式中,后级加DC/DC控制具有相对高的控制精度.为了在负载参数、线圈距
为使天线在同一平面内,多个波束覆盖前向所有工作空域,对天线馈电网络进行了研究.为满足天线对网络超宽带、低剖面、易集成的需求,基于多级阻抗变换技术和微波多层板技术,利
现有风扇不管人体是否需要,都按照预先设定的模式运行,这使得使用者非常被动.利用单片机将人体运动传感器与温湿度传感器相结合,系统先设置26 ℃、26.5 ℃、27.3℃三种温度区