面向异构众核处理器的图像半色调化并行算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:zboboz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像半色调化是一种广泛应用在图像处理领域中的影印技术。近年来随着高分辨率、大尺寸规模图像的应用,传统的图像半色调化串行算法已不能满足实时处理的需求。异构众核处理器的不断发展和大规模的应用,为加速图像半色调化处理指明了方向。然而目前针对图像半色调化算法异构众核加速的相关研究较少。本文所做的工作可分为以下两个部分:针对图像处理领域中比较耗时的图像卷积运算,本文利用异构众核处理器对其进行并行加速。首先对图像卷积运算并行化;然后使用共享存储器优化和寄存器划块优化策略对并行算法作进一步优化;最后分别对比水平一维卷积、垂直一维卷积和二维卷积在不同异构众核处理器平台上的加速效果。实验结果表明,在异构众核处理器平台上,图像卷积算法中优化策略的选取则需要结合具体的应用场景和应用平台。针对图像打印领域中比较耗时的图像半色调化算法,本文利用异构众核处理器对其进行并行加速。首先利用局部邻域理论对传统的图像半色调化串行算法进行改进,显著减少串行算法的计算复杂度;然后采用泊松碟采样法消除数据依赖关系,为算法在众核处理器上并行加速奠定基础;最后采用共享存储器优化、合适粒度任务并行优化、归约树优化、常量存储器优化以及基于纹理存储器的二维缓存优化等一系列优化策略,对并行算法作进一步优化。实验结果表明,在面向桌面端的Intel Xeon CPU+Tesla K20异构计算平台上,并行优化后的算法相对于优化前的初始并行算法性能提升约5~18倍;并行优化后的算法相对于串行算法性能提升约95~110倍。在面向移动端的Tegra K1异构平台上,并行优化后的算法相对于串行算法性能提升约28~32倍。在最新架构的Tegra X1异构平台上,并行优化后的算法相对于串行算法性能提升约50~61倍。
其他文献
随着多媒体技术和网络通信技术的不断发展,多媒体通信业务逐渐在应用中占据主导地位。SIP凭借其简单、灵活、开放、扩展性好等特点,已成为业界研究的热点。本文分析了视频会
21世纪是信息和科技的世纪。信息技术的进步在促进时代发展的同时,也给残疾人带来了前所未有的机遇和极大的挑战。数字图书馆是残疾人获取信息的一种重要的途径和手段。结构
无线传感器网络是由大量低成本的传感器节点组成的无线自组织网络,能够随时随地搜集物理数据,实现人与物理世界的自然交流。无线传感器网络采用在一定区域内布置大量具有感知和
进入新世纪,在宽带无线接入领域,无线网络技术的发展日新月异,一种新的无线网络技术——无线Mesh网(WMN,Wireless Mesh Networks)逐渐发展起来,显示出其巨大的发展潜力,引起
移动机器人的研究开始上个世纪60年代末期,是人工智能、机器人学、仿生学、控制理论和电子技术等多种技术学科交叉的产物。随着科技的发展和社会的进步,机器人已经走出实验室
位置感知的服务(LBS:Location Based Service)是一种通过定位用户的位置信息,从而为用户提供空间位置相关的相应服务的技术。目前LBS的应用以GPS导航为主,个人移动设备上的LB
农业信息化、数字化是21世纪世界农业发展的必然趋势,是农业现代化的重要内容之一。加强农业信息系统化建设是推进农业信息化的基础性工作。农业专家系统经过几十年的发展,其
现在第四代移动通信已趋于成熟,人们更加关注移动宽带网络传输的服务质量(QoS),尤其在多输入多输出(Multiple-Input-Multiple-Output,MIMO)系统下的视频多播方面。随着第五代
互联网、移动互联网等技术的发展,使得服务器上的Web日志急剧膨胀。Web日志记录了上网用户访问Web页面的浏览行为,对网站建设和提供精准服务具有重要的指导意义。但是,原始We
在当前国内配电网信息系统中,管理信息系统重复建设问题严重,这不仅浪费了巨大的财力和时间,而且大量的信息资源不能充分发挥应有的作用。本文提出了构建基于面向服务体系架