基于异构体系结构的图像匹配算法并行设计与优化研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户：msdn_sdk

【摘要】

：

计算机处理器通过传统的以提高主频来提升性能的方式受到了高能耗的挑战，从而使得并行处理成为处理器体系结构发展的主流模式。受到不同应用需求和功耗限制的驱动，异构并行处理

【作者】

：

唐晓新

【机构】

：

上海交通大学

【出处】

：

上海交通大学

【发表日期】

：

2016年01期

【关键词】

：

异构体系结构图像匹配算法并行设计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

计算机处理器通过传统的以提高主频来提升性能的方式受到了高能耗的挑战，从而使得并行处理成为处理器体系结构发展的主流模式。受到不同应用需求和功耗限制的驱动，异构并行处理器逐渐变得普及起来，其中常见的包含了多核CPU、众核GPU、协处理器Intel Xeon Phi等。与串行处理器相比，并行处理器拥有更多的计算单元，因此它们的峰值计算能力也得到了显著提高。　　在实际运用异构计算过程中，程序员受到了来自多方面的挑战：其一，随着异构硬件并行性能的提高，系统各个层次的软硬件都面临成为瓶颈的可能，因此要取得令人满意的高性能并不容易；其二，为了兼顾性能与能耗，硬件发展呈现出高度异构的特点，使得软件在不同体系结构上的迁移变得十分困难；其三，由于多样化的应用需求，程序员不可避免地需要采用多种异构硬件协同合作完成任务的方案，进一步增加了编程的难度。基于上述原因，异构计算呈现出了系统优化跨层面，软硬件强结合以及异构重协同的特点。　　为了更好地利用异构硬件强大的计算能力，就需要对现有的软件，尤其是其核心算法进行针对性的设计与优化。本文从多个角度研究了基于异构架构的图像匹配算法并行设计与优化的一般性问题，并取得了如下的研究成果：　　设计和实现了空间效率更高且适合于并行化的图片像素匹配算法：图片的像素匹配算法具有高时间复杂度和高空间复杂度的特点。本文从应用的角度入手，着手于降低算法的空间复杂度并提高其并行性能，提出了多锚点像素匹配算法。和原算法相比，它的空间复杂度降低了一维，从而能够在不同的异构硬件上实现。本文进一步研究了该算法的并行优化方法，提出了在多核CPU上的粗、细两种粒度的并行化方式，并结合GPU的特点改进了其数据结构，取得了明显的性能提升；　　?总结和归纳了图片特征匹配问题在异构架构上的性能瓶颈问题：特征匹配问题大量存在于机器学习、机器视觉等研究领域，具有广泛的影响力。本文从系统分析的角度入手，测试了不同匹配算法和数据在多种异构并行架构上的性能，并总结和归纳了常见的性能瓶颈，如缓存利用率低、内存访问争用及系统调用争用等。通过大量收集运行时数据，本文详细分析了这些瓶颈产生的原因，提出了分治归并方法来对算法处理过程进行优化，从而规避了上述瓶颈，并取得了显著的性能提升；　　?设计和实现了可动态调整精度的特征过滤算法：近似算法在特征匹配问题中使用非常普遍，而现有研究中同时考虑算法并行性和精度问题的还比较少。本文从算法精度的角度入手，结合它们在并行异构架构上遇到的瓶颈问题，提出了具有通用性的特征过滤算法，可以明显降低匹配过程中的计算量和内存访问次数。同时，本文设计了动态调整过滤精度的方法以适应不同的数据分布，从而取得了性能与精度之间的平衡；　　?设计和实现了基于众核GPU的高效k-selection选择算法：研究发现k-selection选择算法是特征匹配问题在GPU上实现时消耗最多计算时间的部分。对此，本文从算法优化的角度入手，针对GPU架构的特点和算法的内在特性，设计了全新的选择算法。该算法使用了新的归并排序队列、带缓冲区的搜索技术以及多层划分技术，能够有效提高其在GPU上的性能，从而解决了特征匹配算法在GPU上加速效果不明显的问题。　　综上所述，本文从异构架构并行图像匹配算法分析与优化，以及设计与实现两个角度展开了充分研究，总结了具有一般性的性能瓶颈和优化思路，设计和实现了多种新算法，并取得了显著的性能提升。

其他文献

基于J2ME与SVG的移动公交信息服务系统的研究与实现

当前,随着城市交通需求量日益增大,交通拥挤等问题严重影响了城市环境。公共交通与其他交通工具相比,具有载客量大等无法比拟的优点,实现公共交通的智能化管理,提高公共交通

学位

J2MESVG矢量图路径选择坐标转换移动地理信息系统

基于WCF的遗留系统并行架构的设计与实现

随着商业环境的快速变化,以及技术的不断创新,各个行业里的遗留系统面临着越来越大的生存压力。为了改变遗留系统的这些现状,从20世纪90年代以来,涌现出了许多解决办法,大量

学位

遗留系统并行架构内存泄露集群负载均衡WCF

基于神经网络的BBS热点话题预测方法研究

互联网的便捷性和跨地域性，使它成为民众表达意见、讨论公共事务、参与政治经济决策讨论的公共平台，伴之而来的就是网络舆情的收集和管理问题。网络舆情具有的传播速度快、地域

学位

网络舆情BP神经网络热点预测网络爬虫BBS数据Web数据获取

基于本体语义的模型转换关键技术研究

模型驱动体系架构(Model-Driven Architecture, MDA)是OMG组织于2001年3月提出的一种新的软件体系结构方法学,其核心思想是抽象出与实现技术无关的平台无关模型(Platform Ind

学位

MDA模型转换本体PIMPSM语义本体库

空间数据模型及地下管线系统的研究与实现

空间数据模型作为空间数据信息组织和管理的理论基础,在推动GIs发展的过程中起了重要作用。空间数据模型的发展经历了三代：CAD数据模型、Coverage数据模型、Geodatabase数据模

学位

空间数据模型地理信息系统Geodatabase地下管线三维可视化

基于行为图和三方决策机制的可信云服务模型

数据爆炸性的增长,面对几何性增长的数据,我们的个性计算需求也日益加强,具有高计算能力的云计算正被大众所接受。云计算服务因其提供的服务成本低并且质量高,不断受到大众的

学位

证据量化可信云用户三方决策主服务器备份服务器

基于层次结构特征的数学表达式检索模型

数学表达式是科技信息的重要表达形式,实现数学表达式检索有助于科技信息的高效交流与利用。针对数学表达式复杂二维结构特性所导致的普通文本检索技术难以对其进行检索的问

学位

数学表达式索引检索层次结构基线Treap

基于结构分析的可视媒体智能处理技术研究

近年来，随着电子技术、数字媒体和网络技术的发展，数码相机、智能手机变得越来越廉价和普及，同时以图像和视频为主的可视媒体分享网站如Facebook、YouTube和Flickr等也越来越流

学位

可视媒体图像重压缩本征图像人脸配准

P2P网络中双层结构信任模型研究

随着P2P网络技术的快速发展,其在各个领域的应用得到不断扩大的同时,P2P网络固有的开放性和匿名性也为提供虚假文件、恶意攻击等恶意行为提供了可乘之机,这些恶意行为严重影

学位

P2P网络双层信任模型树形结构信誉值计算RTBTTM

基于数据流挖掘的入侵检测系统的研究与应用

入侵检测软件在现在的安全软件中占有重要的地位。近十年来,数据挖掘技术在入侵检测系统中得到广泛的研究。随着实际的要求和技术的进步,现在的网络速度越来越快,因此网络数

学位

入侵检测数据流挖掘信息熵Hoeffding界概念漂移

基于异构体系结构的图像匹配算法并行设计与优化研究

与本文相关的学术论文