支持高性能I/O的处理器结构研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:l309553042
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
I/O系统是计算机与外界交流的通道,从计算机系统诞生起就在计算机系统中占有重要地位,以TPC系列和SPECWEB系列为代表的I/O密集型应用已经成为计算机系统应用的重要组成部分。与此同时高速I/O总线和高速I/O设备的发展也对高性能通用处理器的I/O处理能力提出了更高的要求。   本文从处理器结构设计的角度对提升处理器I/O性能进行了研究。首先,提升I/O系统可访问的存储层次的位置,使之高于处理器最后一级cache,不仅可以简化处理器硬件I/O一致性协议的实现,同时还为I/O系统利用处理器最后一级cache提高I/O性能提供了可能。其次,提出DMA Cache技术,使得处理器和I/O设备可以通过处理器最后一级cache和DMA Cache交换I/O数据。最后,针对以太网I/O应用使用片上Scratchpad Memory来消除以太网接收和发送过程中的基于每个帧的开销。   本文的主要贡献如下:   1.提出提升I/O系统可访问的存储层次的位置,使之从内存系统层次提升至高于处理器最后一级cache层次。I/O系统可访问的存储层次的位置的提升,不仅可以简化处理器硬件I/O一致性设计与实现,还为I/O系统利用处理器最后一级cache来提高I/O性能提供了可能。   2.通过对I/ODMA访存行为的分析,观察到I/O访存与CPU访存在行为上有很大不同。根据I/O设备和处理器在访存行为上的区别,提出使用DMA Cache技术在处理器中分离CPU数据和I/O数据,并使得I/O设备和处理器可以通过DMA Cache和处理器最后一级Cache交换I/O数据,从而提高I/O系统性能。实验结果表明,相对传统的Snooping Cache技术,DMA Cache可以得到平均34.8%,最大58.4%的性能提高。实验结果还发现,已有研究工作提出的被学术界和工业界广泛认可的Share Cache技术,虽然也能得到较高的I/O数据Cache命中率,但反而降低性能(最大-15.1%)。   3.针对网络I/O,已有研究工作都致力于消除基于每个字节和基于每个TCP包的开销。本文指出在以太网I/O中还存在一种基于每个以太网帧的开销无法被现有优化技术消除,并提出使用片上Scratchpad Memory技术来消除这种开销。这种Scratchpad Memory的实现只需要修改处理器最后一级cache的替换算法。在基于四核龙芯3号处理器的平台上的性能测试表明,基于每个以太网帧的开销的消除对短以太网帧能得到6.4%的性能提高。
其他文献
在现代工业控制领域,已经出现了众多功能相似而实际上又不相同的产品,这些产品之间经常需要互相通信,而由于这些产品由不同生产商开发,因此他们的接口并不一样,不能直接进行
CRM(客户关系管理)是一种以客户为中心的企业经营管理模式,它不只是一种信息技术,还是一个获取、保持和增加可获利客户的过程,同时也是一种以客户为中心的企业运营模式。CRM
学位
学位
移动Ad hoc网络(MANET)因其不依赖于任何固定基础设施,支持快速部署的特性而广受关注。在一些特殊、极端的环境中,例如战场、紧急事故、临时突发场合和太空探索等。由于不能
学位
林分树木可视化是运用虚拟现实技术,以图像的方式对林分数据进行可视化模拟并展示出林分树木的生长分布情况。论文实现主要包括树木建模、场景图的组织和优化等部分。树木建
随着人们对软件开发效率和软件产品质量需求的提高,软件复用技术和软件测试技术成为了软件行业的研究热点。可复用测试用例库将具备复用能力的测试用例收集起来供测试人员复用
随着网络技术的持续发展,以及面向服务的计算、普适计算等新计算范型的不断涌现,Internet正在由最初的内容服务的提供者开始逐渐发展成为以提供计算能力为核心的高层次应用服
面对Internet的信息数量之多,覆盖范围之广,用户如何才能及时、准确地搜索有效信息就显得格外重要。在这个巨大的需求之下,搜索引擎迅猛发展,搜索网站也日益多样化。通用搜索
Petri网作为一种严格定义的形式化数学模型,适合用来建模具有并发、异步和冲突的复杂信息系统。本文针对复杂多工序的钢铁制造流程,提出以时间参数为主轴,利用高级Petri网的随机
随着市场竞争的日益激烈,各行业需求的频繁变化,作为企业管理信息化、业务过程自动化的一项关键技术—工作流技术,其可靠性、完善性、可塑性、适应性研究成为当今研究热点之一。