面向主动存储服务处理的可重构计算技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xushieng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动存储将用户数据的应用处理下放到存储设备一级,为信息安全、多媒体信息处理以及数据挖掘等数据密集型应用提供了一种有效的解决途径。目前关于主动存储系统的研究工作都是在由分离式部件构建的存储设备控制器上展开,利用控制器上通用处理器的空闲处理资源进行主动存储服务的处理。这种方案的缺点是硬件成本高、功耗较大。基于片上系统(SoC)硬件实现的存储控制器具有较好的可定制性、性能高且功耗低,已经成为发展主流。SoC 内部集成的嵌入式处理器的频率远低于通用处理器,采用软件方式进行主动服务处理效率很低,不具备实用性。为了加速较为复杂的运算,SoC 设计可以集成专用硬件进行协同处理。但硬件加速方案灵活性很差,且模块扩展数目有限,不适合用于功能需求灵活多样的主动存储系统。提出利用可重构计算来进行主动存储服务处理,基本思路是在片上系统控制器中集成可重构的硬件处理模块,为存储系统实现高性能且灵活的功能扩展。主动存储应用多种多样,需根据应用特点选择合适的硬件加速架构。在XilinX可编程片上系统硬件平台下,研究了协处理器和加速器方案的特点。实验结果表明,协处理器系统可获得较高的处理效率。由于CPU 直接负责数据传输,协处理器方案会消耗一定的处理器资源,因此该方案适合于数据量较小的高性能主动存储应用。基于PLB总线扩展的加速器方案性能一般,受限于总线传输效率以及中断处理开销。基于交换式MPMC 总线扩展的加速器与内存之间具有点对点直连通道,处理过程中数据传输延时小,性能比PLB 加速器高。两种加速器方案都可以利用DMA 进行数据传输,处理过程中CPU 资源占用少,处理效率不是十分依赖处理器,相比协处理器而言更适合于数据密集型主动存储应用。   提出了集成可重构的协处理器和加速器的片上系统设计方法。可重构硬件设计有别于传统的静态电路,需要设计额外的功能模块对动态重构模块进行控制。解决了动态加速器地址空间映射,重构后硬件模块的复位,以及动态模块与静态模块之间信号传输的问题。实验结果表明,可重构系统的处理效率与静态系统相同,并且更加节省硬件资源。可重构硬件具有较好的灵活性,但重构过程往往需要一定的时间(重构延时在10 毫秒量级),在小文件的处理中频繁的功能重构会严重降低系统性能。研究表明,重构延时主要源于配置数据通过片上总线从内存传输到配置控制器的环节,提出一种配置控制器一级的配置数据Cache 方案。配置数据Cache 采用全相联方式进行组织,Cache 命中时配置速度较改进前可提升10倍。提出一种配置数据Cache 置换策略,算法结合了模块的历史使用频度以及模块的面积。当SoC 芯片中同时集成多个动态处理模块时,可以通过配置调度进一步减小重构延时。针对主动存储服务任务的特点设计了任务调度与配置调度方案。任务调度算法在优先保障多任务并行处理性能的前提下,按先来先服务的原则尽可能的提高单个任务的处理速度。配置调度包含了混合的配置预取以及配置Caching 算法。仿真实验结果表明,配置控制器的配置数据Cache以及配置调度算法均可有效减小重构延时,提升系统性能。   利用以上关键技术,在XilinXML509 开发板(配有V5 LX110T FPGA)上实现了一个主动存储控制器的原型系统设计。片上系统控制器中集成了4个可重构的加速器进行主动存储服务处理。控制器采用RAMDisk模拟硬盘,使用iSCSI 协议进行通信。为了支持主动存储功能扩展,针对T10 OSD SCSI 规范提出一种主动存储服务绑定方案。实验采用了数据安全、数据压缩和图像处理应用作为案例,与软件处理方案(基于400MHz PowerPC440 处理器)进行了性能对比。结果表明,基于可重构计算的主动存储服务处理方案灵活、硬件资源占用较少,且可以极大地提升系统性能,并有效减小任务响应时间。
其他文献
随着大数据时代的到来,数据规模和种类急剧增大,如何在海量数据中找出对用户有用的信息至关重要。Skyline查询作为经典的查询算法,能够有效返回原始数据集上的一组较优子集,将Sky
膜生物反应器(简称MBR)作为膜分离技术与生物处理单元相结合的一种新型水处理技术,近几年,它己成为国际研究的热点技术之一,并逐渐被应用于各种工业、生活废水的处理。   本论
无线局域网的应用越来越普遍,但安全问题一直是广大用户和研究者非常关注的问题。IEEE802.lli标准采用了基于可扩展认证协议(EAP, Extensible Authentication Protocol)的IEE
神经元放电活动的研究是神经科学,心理学和人工智能研究中的一个重要领域,其核心是是否可以捕获特定刺激下神经元放电活动的规律性,即研究大脑结构与功能的关系。近20年来,以
本课题针对专利预警机制的专利信息采集、专利信息分析和专利预警三个阶段进行深入研究,充分运用网络爬虫技术、HTTP协议、DOM元素设计并实现了专利数据收集系统,借助Lucene
协同学理论研究的要点是复杂系统宏观特性的质变。20世纪80年代末,Haken教授利用自发模式形成和模式识别之间存在很强的相似性,提出了将协同学理论运用于模式识别中,并根据序
互联网的迅猛发展,为人们提供了各种信息资源,然而,如此庞大的信息量为人们寻找自己真正感兴趣的信息带来了困难。因此,要为用户提供更好的服务,关键是发现用户的潜在访问兴
在医学可视化领域中,如何进行有效的中心线提取一直是研究人员不断进行研究与探索的方向。较好的提取出图像中管状结构的中心线不但可以使医学应用中基于虚拟路径导航诊断方
本文在综述隐通道分析方法和研究现状的基础上,解决了自动化分析系统源代码中信息流的问题,并将信息流组织成信息流图,设计并实现了一个基于静态分析的隐通道检测框架。本文
在计算机技术迅速发展的今天,人脸识别作为一种直接和友好的模式识别技术,受到越来越广泛的关注。本文主要对基于空间变换的流形学习方法Isomap算法和LPP算法、稀疏描述方法