【摘 要】
:
通过二进制翻译手段将CUDA程序移植到其他异构众核处理器平台特别是国产处理器平台,对扩展CUDA程序应用范围,发挥目标平台的众核优势以及支持民族产业都具有现实意义。设计了
【基金项目】
:
国家高技术研究发展计划(863)(No.2009AA012201), 国家核高基重大专项(No.2009ZX01036-001-001,No.0412-7)
论文部分内容阅读
通过二进制翻译手段将CUDA程序移植到其他异构众核处理器平台特别是国产处理器平台,对扩展CUDA程序应用范围,发挥目标平台的众核优势以及支持民族产业都具有现实意义。设计了CUDA程序的二进制翻译框架,从CUDA程序可执行代码入手,采用"分而治之"的手段,将主机端代码和设备端代码分别翻译。重点介绍了移植过程中几个关键问题的解决,包括设备端代码的提取,计算模型的映射,存储模型的映射,栅栏同步和指令翻译问题。通过实验验证了系统功能的正确性。
其他文献
轮廓角点检测与特征构造是基于轮廓角点的RSI多目标识别算法的关键。针对现有的轮廓角点检测方法在准确性与抗噪能力的不足,提出一种改进的轮廓角点检测算法,构造一种基于目标主轴与轮廓角点的特征串,利用动态规划算法计算特征串间的相似度进行目标识别。算法中把目标主轴的旋转角度作为目标的姿态角。实验证明该算法能够快速地识别出目标的旋转角度,对目标进行分类,且具有平移不变性、旋转不变性、尺度不变性以及较好的抗噪
采用AAM定位特征点、尺度不变特征变换(SIFT)描述特征的方式提出一种基于AAM-SIFT的表情特征提取方法。该方法用特征点周围区域梯度方向直方图描述表情特征;同时根据不同子区域
我科自2008年1月以来,用一次性输液器的茂菲氏滴管自制喂药器,取得满意效果,现介绍如下。
已有的急速学习机(Extreme Learning Machine)的学习精度受隐节点数目的影响很大。无论是已提出的单隐层急速学习机还是多隐层神经网络,都是先确定隐藏层数,再通过增加每一层的
[目的]探讨房山地区糖尿病病人的自我照顾行为。[方法]采用问卷形式时房山地区77例糖尿病病人的自我照顾行为进行调查。[结果]糖尿病病人对足部护理及运动疗法的重视程度不够