多核平台上基于可声明并行性的程序优化框架

来源 :东北大学学报:自然科学版 | 被引量 : 0次 | 上传用户:moimon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多核体系平台上充分、有效地发掘目标程序中各种可用并行性的需求,通过引入"层次关系"、"等价关系"和"特性权重"的支持,提出了一种扩展的TStreams模型,并在此基础上实现了一个基于可声明并行性的程序并行优化框架(FAPOF).该框架支持用户对算法的并行特性进行多角度、多粒度的描述并指定适用的各类并行优化规则.基于用户描述,框架可以编译驱动的方式评估各种优化决策的组合,以半自动化的方式对目标程序进行并行优化.由此可将优化过程中程序员原本复杂、困难的并行优化的"决策"工作转化为可用并行性的"描述"工作.
其他文献
自适应波束形成算法能将零陷自动对准干扰方向,但在干扰源角度抖动等情况下,会使自适应权和数据失配.此外,在快拍数较少的情况下,传统的自适应波束形成方法可能会出现很高的旁瓣.针
基于RS和GIS技术,分析了20世纪90年代至今的秦皇岛市景观格局图谱的时空变化规律.利用1993,2000和2008年的TM影像时间系列的遥感数据,解译出三个时期的土地利用信息,选取了斑块数量比、平均斑块面积、平均斑块周长、周长面积比、分维数和聚集度指数来分析三个时期秦皇岛市景观空间格局.利用转移矩阵分析近15年来秦皇岛市的景观类型转化规律.结果表明,自然半自然景观类型,如林地、草地和水域的面积
借助心电图门控技术,多层螺旋CT(MDCT)可以采集心脏的跳动信息,但传统的体绘制方法不能满足心脏动态实时重建需求.提出一种采用心电图门控MDCT采集心脏多时相数据,基于图形处理器纹理映射的心脏动态4D实时绘制方法.该方法将采集到的数据、GPU计算获得的材质与光照属性和传输函数数据,分别映射到GPU纹理单元.片元程序实现体数据、光照和阻光度纹理查找,合成最终图像.根据数据采集时间间隔,定时切换体数
按照堇青石化学计量配比,掺杂B2O3-TiO2,采用溶胶-凝胶法配合回流制备了以α-堇青石为主晶相的微晶玻璃.利用差热分析、X射线衍射、扫描电镜等测试手段,对该玻璃样品的晶化过
介绍了一种处理难选铁矿石磁选精矿的直接反浮选工艺.采用XRD,SEM和EDS等手段对原矿、精矿和尾矿的形貌及矿物组成进行了表征,重点探讨了分离过程中矿物的分散特征,为含碳酸
研究了碳化稻壳(CRH)的酸浸除杂、超声酸浸除杂,考察了盐酸浓度、酸浸时间、酸浸温度、酸浸液固比和搅拌速度对除杂效果的影响.得到最佳工艺为:CRH粒度在75μm以下、盐酸质量分
提出了一种计算具有不确定参数(随机载荷、材料、几何尺寸)的机械结构随机响应统计矩的实用方法.采用Chebyshev多项式节点划分基本随机变量水平,开展实验设计.利用Chebyshev多
运用分散模型参考自适应控制方法研究了一类不确定时滞大系统问题.在选择参考模型时,根据系统所期望的性能指标,考虑各子系统的相互作用,保留了互联项.这类不确定大系统的关
针对以往社团划分算法中存在的子团规模过大的问题,在CNM算法的基础上重新定义子团规模,提出了CLCNM社团划分算法.社团划分结果表明,改进后的算法在子团数量和模块度方面要优于CN
考虑了黏弹性系数和脉动流因素,采用牛顿法建立了航空发动机液压管路在基础激励下的非线性流固耦合振动数学模型,并将方程进行了无量纲化.根据梁模型横向弯曲振动模态函数,采