【摘 要】
:
随着存储技术的不断发展,内存芯片的面积越来越小,容量越来越大,密度越来越高,内存单元发生故障的概率也随之越来越大。根据故障模型,人们设计了许多内存检测算法,其中最为常用的、故障覆盖率最好的是March类算法。为了能够检测到各种故障类型,March算法被设计的越来越复杂,检测时间成倍的增长。另外,所有的算法都是被设计用来检测一个内存芯片内部的单元是否存在故障,他们更适用于在工业制造中对内存条出厂前的
【机 构】
:
Department of Computer Science and Technology, University of Science and Technology of China, Hefei
论文部分内容阅读
随着存储技术的不断发展,内存芯片的面积越来越小,容量越来越大,密度越来越高,内存单元发生故障的概率也随之越来越大。根据故障模型,人们设计了许多内存检测算法,其中最为常用的、故障覆盖率最好的是March类算法。为了能够检测到各种故障类型,March算法被设计的越来越复杂,检测时间成倍的增长。另外,所有的算法都是被设计用来检测一个内存芯片内部的单元是否存在故障,他们更适用于在工业制造中对内存条出厂前的检测,并不适用于用户对计算机内存的检测。针对以上问题,提出了一种结合硬件特征的并行内存故障检测方案,它能够有效地解决上述两个问题:既可以成倍的降低March算法的检测时间,又能让用户利用March算法在短时间内对内存进行检测。该方案包含两种并行内存检测方法:一个是根据DDR2的结构和工作原理而设计的芯片级并行,可以并行检测一个DDR2内部的多个内存芯片;另一个是根据访存控制器的结构和工作原理而设计的访存控制器级并行,可以并行检测多个DDR2内存条。实验表明:对于芯片级并行,访存带宽越大(即并行检测的芯片个数越多)并行效果越好,从一个芯片到并行检测8个芯片,内存的检测时间几乎是成线性递减的。对于访存控制器级并行,访存控制器数量越多并行效果越好,从一个LMC到2个LMC,内存的检测时间几乎减少了一倍。
其他文献
NoSQL数据库作为下一代巨型数据的存储模式,在科学计算和商业计算领域均发挥着重要作用,受到当前学术界和企业界的广泛关注,本文提出一种新的基于NoSQL数据库HBase的并行求取最短路径树的方法,首先利用Watts-Strogatz模型完成对巨型网络的数学建模,这种建模方式使得网络模型具有一定的聚类效果:其次利用HBase最近发布的coprocessor对并行BSF方法的简化和改进,简化并行BFS
云计算是当今世界IT行业的研究热点,在云计算实例中存在各种各样的用户对于数据库的请求,并且这些请求是海量的,如果不对这些数据库请求进行合理的分类,必然会对系统的性能造成很大的影响,如何对这些请求进行分类,以达到Web QoS的标准,是云计算研究的一大难点和关键点。原来基于先来先服务的请求模式,不仅不能满足客户优先级的要求,不能达到利益的最大化,而且不能使得服务资源得到充分利用。因此,本研究提出了基
Ad-hoc同步在多线程程序中非常常见。和phtread 库中的正规同步语句不同( 比如pthread_cond_wait),Ad-hoc 同步会隐含地引入happen-before 关系。对于很多错误检测工具来说,这种隐含的happen-before 关系难以被检测,正是这个问题影响着这些错误检测软件的正确性。在本文中提出一种有效地检测ad-hoc 同步的方法,此方法包含编译时分析和运行时分析两
应用GPU通用高性能编程技术设计了一种加速三维叠前随机噪声衰减(以下简称三维叠前RNA)预测算子计算的并行算法。三维叠前RNA是地震资料数据处理的常用技术,能有效提高三维叠前数据的信噪比,去噪效果明显,然而其巨大的计算量,成为工业生产的瓶颈。本文首先分析并定位了三维叠前RNA计算的热点为预测算子计算,然后描述了串行预测算子计算算法及该算法的GPU并行化可行性分析,最后利用CUDA技术设计了基于GP
BLAS 是科学计算中最基础的数学库之一,广泛应用在HPC 领域.IBM 公司提供的针对IBM 硬件平台进行优化的工程科学子程序库(ESSL),包括了BLAS 数学库.本文具体介绍ESSL 中BLAS 库子程序xROT 在IBM 蓝色基因/Q 平台上的实现和优化.本文介绍的优化技术对其它平台上的数学库优化也会有借鉴作用.
MPI是高性能计算领域内的重要标准之一,MPI应用程序的性能通常取决于其MPI集合通信的性能,FCA(Fabric Collective Accelerator)是加速集合通信的一种新方法。本文通过高性能计算环境测试主要分析了FCA共享内存和非共享内存机制对IBM Platform MPI加速效果,FCA的原理以及IBM Platform MPI和FCA的集成,同时也为在高性能计算领域应用FCA提
InfiniBand是目前HPC系统互连的主流网络之一,其提供的可靠连接传输服务因为支持RDMA、原子操作等功能而被广泛应用于MPI等并行应用编程模型。但是支撑可靠连接所需的消息队列及缓冲区开销往往会随着并行规模的扩大急剧增加,从而制约了应用规模的扩大。为了解决这种内存开销带来的消息可扩展性问题,本文先从InfiniBand传输优化方面介绍了共享接收队列和扩展可靠连接技术,然后基于并行通信模型提出
忆阻器是一种可以记忆流经其电荷的无源非线性电阻,在众多领域有着巨大的应用潜力,当前其最直接的用途是作为数据存储的介质,同时它还能用于逻辑操作。本文通过在已有的忆阻器状态逻辑计算方式的基础上,根据通常采用交叉杆阵列结构设计了该逻辑计算方式的并行化,并分析了其进一步扩展的可能性和需要在存储数据结构上的改进,实验结果验证了本文提出的状态逻辑运算并行化的有效性和可行性。
直接模拟蒙特卡罗方法(Direct Simulation Monte Carlo,DSMC)是稀薄气体动力学领域的重要工具。然而,DSMC方法有两个比较主要的缺点:一是复杂的网格处理,另一个是庞大的计算量。使用动态网格的DSMC方法可以根据流场信息,动态生成自适应的碰撞网格,能有效解决前一个缺点:针对后一个缺点,本文则基于动态网格的DSMC方法,使用CUDA编写并行程序,将其移植到GPU上以减少计
中科院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的三层架构超级计算环境。为提升超级计算环境的可靠性,提供稳定可靠的计算服务,其容错机制的研究成为超级计算环境的一个研究重点。本文在对容错基本思想及各类计算机容错技术进行充分调研的基础上,提出一种适用于超级计算环境的容错框架,依据该框架给出了不同层次的容错方案,并对不同层次的容错开销进行了分析和比较,验证不同层次容错方案对应用程序带来的影