基于IA-64的编译器性能测试

来源 :2002年全国计算机体系结构学术会议 | 被引量 : 0次 | 上传用户:liliac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
安腾(Itanium)处理器是HP/Intel公司推出的第一代基于IA-64体系结构的处理器.本文通过在安腾处理器上编译并运行NAS Benchmarks,从程序的执行时间、编译时间、产生的二进制文件大小三个方面对orcc、sgicc、gcc和、ecc四个编译器进行了比较.实验表明,从程序的执行时间方面,orcc和sgicc性能相当,约为gcc的2倍和ecc的65﹪,而且即使在最优的条件下,处理器的资源利用率也仅为70﹪.
其他文献
提出了网络存储集成的概念,按网络技术将网络存储集成分为光纤通道、以太网、Internet三大类,并按不同的协议或集成方法详细描述和分析了当前主要的一些网络存储技术.研究网络存储集成技术对网络存储的应用和研究均有一定的指导意义.
量子计算具有强大的能力,但是在物理硬件尚未实用之前,研究在经典计算机上实现量子计算具有重要意义.本文研究了在具有向量处理部件的银河TS-1上进行量子计算的基本方法和性能,分析了体系结构对量子计算性能的影响以及改进.
生物序列拼接问题,是生物信息学中的关键问题之一.phrap算法是目前最常用的拼接算法,然而phrap算法的运行时间以及对内存空间的庞大需求,已成为生物数据处理的瓶颈.针对这一问题,本文分别对phrap算法的3个步骤提出了不同的并行策略,并且利用MPI和OpenMP在曙光3000并行计算机上实现了phrap的并行化,获得了较好的结果.
媒体服务器提供多种媒体数据的在线访问服务.在网络环境下,用户的数量和数据的规模是巨大的,这就要求媒体服务器不但要提供巨大的存储容量而且要提供足够的服务带宽.媒体服务器的工作负载往往表现出数据访问的局部性,根据这一原理,采用层次化的存储系统来构造媒体服务器可以获得较高的性价比.除了用磁盘和磁带(或光盘)构成层次化的存储系统外,还可以用不同性能的磁盘阵列构成层次化的磁盘存储系统,本文就以HP的Auto
建立一个关于计算过程的假说,提出了模型的序,计算机的流和流序匹配等概念,以及流序结构的特征.根据假说,并行流程图具备N+1个序,需要并行计算机有N+1个流结构.第N+1流结构所含的参量,解释了上个世纪在分布和并行处理研究领域没有形成产业的原因.在假说的推理中,提出了一种具备通用性的原理计算机结构,称为序网计算机.此外还指出并行计算中的数值计算和计算过程有不同的空间特征.
量子密码是当今的热点技术之一,是量子力学和密码技术相结合的产物.本文介绍了量子密码理论基础与基本原理,简要说明了量子通信方式和3个基本的密钥分发协议,指出了发展量子密码存在的一些问题.
由于机群系统的可扩展、容错和高性价比等优越,使其成为构建可扩展的、高可用的、高性能的网络服务的自然平台.但由于目前尚没有针对机群系统的、适于网络服务的存储平台,所以机群系统中分布式数据管理仍是棘手的任务.本文介绍的TODS系统是一个可扩展的海量对象数据存储平台,提供分布式的透明持久化对象支持,将可扩展和高可用等复杂功能抽象成独立的可重用功能层,支持事务处理.与使用文件系统和关系数据库系统相比,本系
首先介绍NAS存储服务器的一般性概念,并介绍它和普通文件服务器的区别、它和DAS、SAN的区别.然后重点阐述NAS存储服务器的软硬件体系结构和I/O路径并对NAS存储服务器的具体实现作了详细的阐述,其中包括:I/O接口、嵌入式OS、存储管理软件以及网络文件协议等.最后对NAS存储服务器的下一步发展做了深入的分析,尤其是DAFS技术.
基于CSIM仿真软件包设计与实现了一种能对SIMD结构计算机进行性能评价的仿真器.重点阐述了SIMD虚拟机的建模过程,并介绍了仿真器的运行流程.
首先简要介绍了集成CC-NUMA特点的大型SMP超结点设计思想,然后提出了用这种思想构建规模为8、16、32、64、128处理器的大型SMP超结点的互连结构,并进行了访存延时分析.最后给出了一个32处理器系统的性能分析和模拟,结果表明,这种新的大型SMP超结点设计比传统的SMP超结点的性能更优越.