基于异构计算系统的图像信息提取关键算法研究与实现

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:pazixu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,图像信息科学在生活中被越来越广泛地应用,图像信息提取技术也相应成为了该领域的研究热点,其中图像小波变换算法和K近邻分类算法作为常用图像特征提取算法及分类算法,广泛存在于各类图像信息提取系统之中,应用于场景识别、基于内容的图像搜索引擎、刑侦图像分类、计算机机器视觉等各个领域。然而随着实际工程中图像数量与规模的日益增长,以及人们对高性能低功耗计算越来越迫切的需求,图像小波变换算法和K近邻分类算法的现有实现方案正愈发显得捉襟见肘,使用FPGA+CPU架构的全新异构计算系统为探索该类算法的高效实现提供了可能。与超级计算机或分布式计算系统的解决方案相比,使用FPGA+CPU架构的异构计算系统体现出了成本低、占用空间少、可修复性较好等优点;与采用GPU实现的异构系统相比,采用FPGA具有低功耗、高能效等优势。综上,本文采用FPGA架构的新型异构系统,对图像小波变换和K近邻分类这两种图像信息提取技术中的关键算法进行OpenCL异构并行加速研究。本文设计了两种图像小波变换算法FPGA异构加速实现方案,方案一采用行卷积内核与列卷积内核实现;方案二采用行卷积内核与矩阵转置内核,通过内核复用的方式进行实现。结合并行奇偶排序和并行冒泡排序的特点,本文设计了一种K近邻分类算法FPGA异构加速实现方案,将算法拆分为相似度计算内核与相似度排序内核,在相似度排序内核中的不同阶段采用K并行奇偶排序与K并行冒泡排序,达到了精简硬件结构,优化硬件资源的目的。最后对图像小波变换算法和K近邻分类算法进行了异构并行加速实现。采用AOCL工具提供的优化方法,对FPGA加速设备端内核进行了向量化处理以及多条流水线复制等优化,提高了FPGA系统资源利用率,并提升了系统性能。在对比项上采用了CPU平台实现以及GPU平台实现,并从算法的计算速度和能量转换效率上做出了详细的对比分析。测试采用不同的公用图片库和数据集,结果符合理论预期。本文设计的FPGA平台的图像小波变换异构并行加速方案相比GPU平台实现能效比提高了23.7%;K近邻分类算法排序阶段采用并行奇偶排序结合并行冒泡排序的方案进行异构并行加速实现,在能效比方面比仅采用k并行冒泡提升了18%。
其他文献
本文将通过分析装配式住宅的含义与构成以及特点,然后对我国装配式住宅的发展与装配式住宅的相关设计做出了深入的分析,从而希望对有关行业人员提供参考.
无线通信技术和计算机网络技术的快速发展为无线移动通信网络奠定了基础。MANET正是在此环境下诞生的,并逐渐成为当前移动网络研究的重点。路由技术担负着为数据分组寻找路由
流密码最早主要广泛应用于政治、军事和外交等领域,目前已扩展到民用领域,如遥测数据的加密发送和接收等。流密码研究的关键问题之一是密钥流生成器的构造和设计。如何设计伪
随着现有网络规模的不断扩大,各种业务的不断扩展,以及各种新的业务如三网融合、物联网、云计算等等都对网络提出了新的要求,使得传统网络越来越不适合当前互联网的发展。网
多射频多信道(MRMC)无线Mesh网络(WMN)以其多跳、自组织、大覆盖范围等优良特性,逐渐成为了一种低成本的无线接入方式。但是随着其越来越广泛的应用,WMN也暴露出多跳后链路质
随着计算机网络的普及及其技术的发展,基于网络的视频应用越来越普遍。在因特网上视频支付服务越来越重要,这一领域应用数量的不断增长,使得研究如何在因特网上执行公平的在
医疗建筑空调的节能设计不仅关系到医疗机构能否下正常的供热制冷,而且还关系到医疗工作是否正常有序进行,因此必须使用现代空调设计技术,在全面考虑医疗建筑个性化需求的基
无线Mesh网络拓展了通信距离、搭建速度快、数据通信可靠且高效,可应用于油气田勘探、应急通信、无人机通信等场景,受到国内外越来越多学者的重视。但是由于无线信道的不稳定
随着网络规模的不断增大,为了更好的管控网络,网络服务提供商需要对网络的时延、丢包率、流量矩阵等性能参数进行测量与分析。但是,传统IP网络中的测量方案通常缺乏灵活的控
IMS是IP多媒体子系统的英文简称,最早是由3GPP通信标准化组织在R5版本第三代移动通信核心网中首次引入,并在R6、R7版本中对IMS进行了进一步的扩展。IMS起初仅仅是针对移动网