基于OpenCL的直方图生成算法优化方法研究

来源 :计算机科学 | 被引量 : 6次 | 上传用户:zywlaoying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPU计算能力及可编程性的不断增强,采用GPU作为通用加速器对应用程序进行性能加速已经成为提升程序性能的主要模式。直方图生成算法是计算机视觉的常用算法,在图像处理、模式识别、图像搜索等领域都有着广泛的应用。随着图像处理规模的扩大和实时性要求的提高,通过GPU提升直方图生成算法性能的需求也越来越强。在GPU计算平台关键优化方法和技术的基础上,完成了直方图生成算法在GPU计算平台上的实现及优化。实验结果表明,通过使用直方图备份、访存优化、数据本地化及规约优化等优化方法,直方图生成算法在AMD HD7
其他文献
介绍一个多通道采样率的数据采集系统。该系统输入64个模拟量均要转换成数字信号,数据采集卡为基于VXI总线的E1413,多通道之间的变采样率通过特殊的采样列表实现。文中给出了硬
概述了智能建筑网络系统的产生过程和现状,探讨了智能建筑网络系统的发展趋势。提出了一种全新的智能建筑系统管理的集成方式,并分析了产生这种发展趋势的原因。
通过对不同状态单晶镍基合金进行组织形貌的观察和X-ray衍射分析,研究了组织演化对合金中γ'、γ两相晶格常数和错配度的影响.结果表明:铸态单晶合金不同区域中γ'相的形貌和尺寸
详细介绍了基于单片机的太阳能热水器自动控制系统组成、硬件设计和软件设计。该系统以单片机为核心部件,采用强迫温差跟踪循环方式充分利用太阳能进行加热,并弥补太阳能自身不
研究了PCI计算机总线超高速数据采集与DSP系统的设计与实现.系统采用PCI总线及I,Q支路双通道设计,通道采样率均为500MHz,系统存储深度为2MB,中央处理器采用高速DSP TMS320C62
将数据融合方法引入高温炉窑温度检测系统 ,充分利用现有检测系统的能力 ,在不增加任何设备的情况下提高检测精度 ,并且证明该方法具有理论简单、易于实现、精度高 ,适用于各种高温炉窑温度检测系统。
分析了(Bi,Pb)-2223高温超导材料传导性能进一步提高的影响因素,阐述了熔化处理对改善(Bi,Pb)-2223带材芯部微观结构的优越性.结果表明,传统的(Bi,Pb)-2223相非平衡成相机制严重制约了熔
文章提出了一种直接测量角加速度的单片机系统,详细介绍了系统硬件结构和程序框图,并分析了测量误差。
功耗管理是云计算数据中心的重要问题之一。由于服务器在不同睡眠状态时的功耗及唤醒延迟不同,将空闲服务器节电状态与输入作业负载建立映射,设计并实现了一种新的元启发式调
针对奥氏体合金中次生η相与基体位向关系存在的不同看法,研究了铁镍基奥氏体合金大量次生η相的析出机理,结果表明,η相与基体之间有良好的共格关系:{001}η//{111}γ,(110)γ//(210)η.晶