受限体系结构下并行排序算法研究

来源 :第九届计算机工程与工艺全国学术年会 | 被引量 : 0次 | 上传用户:yeshi804883653
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
单处理器构成的嵌入式系统无法满足高性能需求,嵌入式并行系统应运而生.典型的嵌入式并行系统表现为:I/O通道带宽有限和处理单元(PE)局部存储容量有限.我们在该受限体系结构下设计了一种并行排序算法,在这种算法中,各个PE并行地对其中的局部数据进行堆排序,生成的多个子序列被返回给主控CPU进行串行归并排序.我们对该算法的加速比进行了详细的分析,描述了I/O通道带宽、PE局部存储容量和并行性能之间的关系,最后还给出了一种改进方案.
其他文献
本文扼要介绍了预应力混凝土结构的概念及工作原理,总结了近十年来黑龙江省在预应力混凝土结构方面的创新与贡献,提出了黑龙江省发展预应力混凝土的若干建议.
本文针对目前房屋建筑中广泛使用的预应力混凝土空心板存在的不足与缺点,改进设计了一种新型的后张法施工的高强度大跨度预应力混凝土空心板,并且进行了原型试验.从理论上探讨了预应力混凝土梁的等效荷载法,此法能够方便地分析曲线预应力筋梁,建立不必按力筋曲线剖分网格的等效模型,用于有限元分析方法中的简化分析.最后结合试验板原型试验实测结果,等效模型、实测数据与理论值均吻合良好,证明了试验板的结构可靠性及等效荷
张石高速公路南水北调大桥为40+60+40m预应力混凝土变截面连续梁,施工图设计过程中,由于种种原因,结构设计多次变化,预应力的施加方法也有较大差别.本文对悬臂浇筑法,满堂支架的分次张拉法及满堂支架的一次张拉法的设计构思及其各种方法的应力、经济性进行综合比较.指出这三种方法各自的优缺点及设计和施工的要点.
Call和Return指令是出现频率较高的两种分支指令形式,为了提高Call指令和Return指令的预测精确度,本文提出了一种双返回堆栈(RSB)的分支预测方法,即利用预测RSB和真实RSB两个独立的RSB进行预测.预测RSB中的内容由预取的指令信息填充,真实RSB中的内容由真正执行完毕的指令信息填充.当预测错误时,可及时地将真实RSB中的内容复制到预测RSB中,以尽可能的减少性能损失,提高预测精
本文介绍了双通路浮点加法器的基本算法,并在X微处理器上实现了浮点加法器,描述了加器、前导0预测等部件的功能与实现,阐释了浮点加法实现的基本要点.
本文讨论了一种低功耗高效能的新型值预测模型,然后通过实验从性能与功耗比率的角度将其与目前值预测中采用的几种预测模型进行了比较,验证了该模型较其它模型的节能高效性.
在InfiniBand网络互连中,电缆组件是一种非常节省成本的可靠解决方案.本文系统研究了电缆组件中应用的不同均衡技术,并通过建立专门的测试系统,对采用不同均衡技术的长线电缆组件进行了评估与对比分析.
FPGA仿真是IC设计领域普遍采用的验证手段.对于一般的ASIC设计,将其转换到FPGA仿真平台相对比较容易,而在对全定制高性能微处理器进行FPGA验证时,由于设计的特殊性,这种转换工作相当困难.本文结合项目实际,设计了一个辅助程序,用于加快转换速度,并减少转换出错的概率.实践表明,该程序简洁有效,使用方便,达到了预期的效果.
嵌入式软件开发中,一个方便实用的嵌入式开发环境可以大大加快嵌入式软件开发调试的进度,本文分析了常见的嵌入式开发环境的优缺点,根据嵌入式系统资源匮乏的特点,设计了自定义的嵌入式通讯协议栈,并结合多线程以及管道技术,实现了一种基于以太网的嵌入式系统开发环境.
随着科学技术尤其是计算机技术和通信技术的发展,摊夹摊名的场合需要讲行远程数据通信.本文论述一个由单片机和双端口存储器构成的加密机,并且阐述了加密机的工作原理和操作流程.