【摘 要】
:
随着GPU的计算能力、访存能力和设备内存容量的不断提高,将GPU作为独立的数据存储节点来使用正在成为可能。动态内存管理是数据存储节点的必备功能,但是大量的并发线程以及单
【机 构】
:
中国科学技术大学计算机科学与技术学院,
论文部分内容阅读
随着GPU的计算能力、访存能力和设备内存容量的不断提高,将GPU作为独立的数据存储节点来使用正在成为可能。动态内存管理是数据存储节点的必备功能,但是大量的并发线程以及单指令流多数据流的执行方式,使得GPU上的动态内存分配面临冲突率高、线程阻塞严重等问题。本文针对GPU体系结构特点以及数据存储类应用对设备内存管理的需求,在NVIDIA GPU上设计并实现了一个GPU设备内存管理器,可有效降低内存分配竞争,并提高内存分配速度。基于所设计的设备内存管理方案,本文将一个无锁哈希表实现移植到了GPU上,以加速GPU上的索引操作。实验表明,本文实现的GPU内存管理器和无锁哈希表具有较好的性能。
其他文献
在中国人民革命军事博物馆土地革命战争馆展厅里的一个展柜中,陈列着一组物品:衣扣、皮带扣、毛衣碎片、鞋底等。它们是长征中牺牲的红军最高将领,红三军团参谋长邓萍留下的
采用点焊工艺制备的绕线电感器,当受到外力作用时焊点存在脱落的风险,对其焊点脱落失效机理进行深入研究和分析可知,主要是由于焊接强度不足.通过对电感器底座的优化设计和焊
随着光纤通道总线的应用和发展,其支持的数据传输速率逐渐增高,最高速率已经达到8.5Gbps甚至更高。针对不同速率的光纤通道接口需要相互适配的需求,我们利用高速串行收发器的
人脸速写是边缘检测技术的一个特殊应用。针对当前流行的边缘检测算法难以在人脸速写应用中有效实施的难点,设计了一种以NXP公司MK60DN512VLQ10单片机为核心控制单元,以改进的Sobel算子为边缘检测算法的人脸速写系统。系统采用低功耗CMOS图像传感器OV7620进行人脸信息的采集,采用一种改进的Sobel算子进行人脸轮廓的提取,改进的算子采用45°,135°,225°,315°四个方向模板进
室内定位系统是一种利用WIFI网络来实现标签的定位,可以在已有的WIFI网络或无线局域网上实现定位引擎,在智能家居,人力资源管理等方面开始得到广泛的应用。由于室内定位系统
1在电竞选手奖金收入排行榜上,Evil Geniuses战队的选手依靠TI5的超高奖金霸占了榜单前几名,ppd、UNiVeRsE、Fear和SumaiL的奖金都达到了173.0076万美元,而被EG放弃的队员Aui_20
图计算在大数据时代有着广泛的应用,高性能图计算系统已经成为一种重要的信息处理平台.随着众核处理器计算性能迅速提高,多核/众核处理器协同已成为实现高性能计算系统的重要
十九世纪英国杰出的浪漫主义诗人约翰·济慈在其短暂的二十多年的人生中,经历了太多的死亡,诗人的敏感使他对生命与死亡这一人生主题反应尤为激烈。死亡,是每一个人都必须面