【摘 要】
:
移动计算设备的飞速发展已经成为转变传统计算设备发展的根本趋势。GPU在图像处理方向应用的同时,也为通用计算提供了良好的运行平台。CUDA是功能完善的图形处理器通用计算编
论文部分内容阅读
移动计算设备的飞速发展已经成为转变传统计算设备发展的根本趋势。GPU在图像处理方向应用的同时,也为通用计算提供了良好的运行平台。CUDA是功能完善的图形处理器通用计算编程API,但其并没有解决移动设备上并行计算的问题。GPU在移动设备上的发展虽然很迅速,但是仅仅依赖片上GPU来提升计算能力,在计算效率和能耗等方面都有很大限制。本文设计了CUDA程序在移动设备上的运行环境,实现CUDA程序在基于Android系统的移动设备上运行。程序经过移植之后,可以实现在Android系统的移动设备上访问位于高性能服务器上的GPU通用计算资源,对移动设备上的高性能计算具有很大意义。移动CUDA运行环境由服务端和客户端两部分构成,客户端部署在Android系统的移动设备,以伪装API方式获取CUDA程序的调用函数与函数参数,将其发送到服务端,在服务端完成对实际GPU的操作。由于采用伪装API方式,原有的CUDA程序不需要引入其他特定的API,实现了兼容性的特点。针对Android平台的CUDA程序移植是建立在详细分析CUDA程序的编译流程上,改变原本的混合编译策略,采用分离不同平台编译结果的方法。在GPU设备端执行的程序编译成fatbin格式,而在主机端执行的C程序则使用ARM交叉编译工具编译成ARM平台的目标程序。经过实验证明,本文实现的CUDA程序移植方法对计算密集型算法性能提升效果显著,具有较好的计算性能和加速比。本文使用的Socket优化方法对于无线网络传输性能也有很大提升。
其他文献
在分布式系统中,对临界资源的访问是需要互斥进行的,所以分布式系统中最先要解决的问题是分布式互斥算法。分布式互斥算法主要分为两类,分别是基于竞争的和基于令牌的分布式
离群点检测是数据挖掘中的一个分支,它的任务是识别其特征显著不同于其他数据的观测值。在我们平常的社会生活和自然界中,大部分的事件和对象,都是很寻常或者是平凡的。但是
语音情感识别是情感计算研究方向的重要研究分支,它通过分析语音中情感的特征,进而识别语音中的情感状态。语音情感识别在翻译系统、航线监控系统、E-learning、移动智能终端等
工作关系网络、计算机网络等是较为常见且与日常生活密切相关的复杂网络。因此,网络中社团结构的探索和挖掘具备重要的实际意义。具有内部社团结构的复杂网络中,内部子社团节
软件缺陷数量是衡量软件质量好坏的一项重要指标,尽早地发现缺陷可以避免在软件开发后期为修改、弥补缺陷造成资源的浪费,保证软件的正常交付。软件缺陷预测模型可用于软件开
随着信息技术与计算机图形学技术的不断进步与发展,越来越多的学者致力于该领域的研究,其中植物建模就是该领域研究的热点之一。利用图形学技术生成虚拟植物,不仅要对植物的形态
查询扩展技术主要用于解决用户提交的查询不能准确描述其自身需求及检索意图的问题。早期的查询扩展技术主要以查询文档集作为扩展词的来源,如今,各种形式的外部扩展资源逐步
近年来,随着互联网技术和多媒体技术的飞速发展,视频数据也呈爆炸式地增长,如何对海量的视频数据分类分析成为一个亟待解决的问题。在对视频分析时,通常先提取视频低层特征,再根据
语音情感识别旨在使用计算机技术来分析说话人的情感状态及变化,进而确定其内心情绪状态或变化,最终实现人机之间更自然、更和谐的交互过程。经过十几年的研究与发展,语音情感识
复杂场景条件下,基于图像的目标搜索与定位系统的性能不仅受目标自身特性的影响,而且受周围场景环境的影响,目标的“非显著”性是导致目标搜索性能降低的主要原因。视觉注意