基于Torus的并行计算机网络可靠性研究

来源 :广西大学 | 被引量 : 0次 | 上传用户:b188413920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着电子器件的发展,计算机的处理能力有显著提高。但是,仅仅依靠电子器件的发展而达到的速度提高,远不能满足现代科学、工程技术和其他许多领域对高速运算能力的需要。这就要求人们改进计算机系统结构以及采用各种并行处理技术,以便大幅度地提高处理速度和运算能力。其中,以并行计算机系统为核心的计算机平台占据着极其重要的地位,基于Torus的并行计算机系统具有对称性、良好扩展性、规则、易于VLSI实现及路径多样性等诸多优点而备受关注。然而,由于并行计算机系统通常应用于非常重要的计算、控制和研究领域中。因此,系统一旦发生故障,将带来不可估量的甚至灾难性损失。为使并行计算机系统在运行或生产过程中能够保持正常运行,对其可靠性进行研究是重要课题之一。   本文首先介绍本课题相关的预备知识,包括并行计算机与高性能计算机的关系、并行计算机体系结构、基于Torus的并行计算机网络的定义、可靠性的基本概念、可靠性发展概况、可靠性的重要意义、以及指数分布函数和马尔可夫过程等相关知识。   接着应用马尔可夫过程研究基于Torus的并行计算机网络的可靠性。通过建立马尔可夫过程各状态空间图,且将状态图转换为可靠性模型的数学表达式,分析了结点失效相互独立条件下的Torus网络的可靠性,并将不同规模的Torus网络可靠度数值计算结果进行比较,结果表明网络运行时间越长或网络规模越大其可靠性越低的一般规律。然后进一步分析结点失效相关的Torus网络的可靠性,并将数值计算结果与结点不相关的Torus网络可靠性进行比较,结果表明结点相关的Torus网络可靠性低于结点不相关的Torus网络。   最后采用组合模型和递推分解的思想对大规模Torus网络的可靠性进行分析,其目的是避开应用马尔可夫过程求解计算遇到的NP难题。对特大规模的Torus网络,递推分解算法还可以通过采用可靠度上下界逐步逼近的方法,得到一定精度的可靠度近似值。数值结果表明:在结点失效概率均小于0.10%时,对多达上千个结点的Torus网络仍超过0.9106352的可靠度。
其他文献
粗糙集理论是一种有效地分析和处理不精确、不一致、不完整等各种不确定性信息的数据分析理论。泛系理论是一个注重挖掘事物的本质、寻找事物之间联系、以及变化与变化之间联
信息技术的发展和企业服务意识的提高,致使呼叫中心逐渐得到了企业的青睐。在日益激烈的市场竞争中,作为现代企业在商战中谋求生存的关键机构和在竞争中争胜的有力武器,呼叫中心
图像识别是计算机视觉领域中利用数字图像处理技术和模式识别方法识别图像中的感兴趣目标的技术,被广泛应用在合成孔径雷达图像辨识、地图导航、车牌目标检测、医疗病变诊断
随着计算机软硬件的迅速发展,计算机的应用领域越来越广。用户群也由原来的少数计算机专业用户扩展到了很多非专业的用户。这就意味着计算机的人机交互界面由过去的人适应计
随着目前处理器功耗的增大,芯片的性能遇到了瓶颈。过高的温度降低了处理器的性能、可靠性和寿命。现代处理器用调节电压和降低频率作为缓解功耗与温度问题的首选措施。但是
随着Internet技术的不断发展特别是网络搜索引擎技术的发展,用户想要得到自己需求的网络链接成为越来越容易的事情。近几年,越来越多的领域搜索成为网络搜索引擎的又一新兴方
云通常和各种天气现象密切相关。地球上平均有1/3到1/2的地区覆盖着云层。云是天气过程的重要扮演者。近年来,随着数字化卫星云图资料的出现,对卫星云图进行定量分析已成为各国
碰撞检测是计算机动画、计算机图形学等领域的重要课题。近几年来,随着虚拟现实技术和分布式仿真技术的兴起,碰撞检测问题成为一个研究热点。快速的碰撞检测对提高虚拟环境的真
网格中的副本技术是对等网络分布式存储中一个基本的、重要的环节。通过合理的副本技术可以提高网络利用率并达到更好的负载均衡。在副本技术研究中,设计副本技术在不同领域的
业务规则技术是实现企业业务规则表述、维护、部署和执行,将业务规则与应用代码相分离,从而最终实现高效灵活地企业控制的核心技术。研究和推广业务规则技术对企业信息化具有