PC平台上PCI9052数据传送性能分析与优化

来源 :商场现代化 | 被引量 : 0次 | 上传用户:qghlxj1399
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 本文分析了PC平台上PCI接口芯片PCI 9052的数据传送性能及读写速度慢的原因。给出了相应的提高PCI9052读写速度的优化方法。综合采用本文提出的优化方法实现的实验结果,使读写速度提高了一倍。
  [关键词] PCI9052 读写速度 分析 优化
  
  PLX PCI9052是最常用的PCI接口芯片。其低廉的价格和良好的数据传送性能,得到了普遍的应用。它可实现高性能的猝发式数据传输。但在PC平台实际应用上,读写速度却远远低于这一速度,没有充分发挥它所提供的数据传送能力。本文将就其读写速度问题进行分析,并给出提高读写速度的方法。
  一、读写速度分析
  PCI9052是一种能提供混合高性能PCI总线目标(从)模式的接口芯片,支持低成本从属适配器。该芯片可与多种局部总线相连,芯片内部包括一个64Byte的写FIFO和一个32Byte 的读FIFO,通过读写FIFOs,可实现高性能的猝发式数据传输,可提供133MB/s的猝发传送速率。但在PC平台上,PC到PCI9052的实际速度一般却为4~5MB/S的读。
  造成读写速度慢的原因有两种:
  1.系统效率
  PC平台是在操作系统的管理下,需要通过各层次的调用才能访问到具体硬件。这样对PCI设备的访问效率自然就降低了很多。另一方面,操作系统中和其他应用程序及进程,也需要占用大量的CPU时间,这样对PCI设备的访问效率上就会降低很多。另外,PCI是共享总线,如果有多个PCI设备存在,则每个PCI设备的访问效率还要受分时访问的影响。
  2.猝发模式
  造成读写速度慢的根本原因,就是读写模式。虽然PCI9052可实现高性能的猝发式数据传输,但对于PC平台来说,实际并没有实现高性能的较长的连续猝发式数据传输。
   在x86(Intel)结构中,CPU发起的到PCI从设备 的读是通过北桥芯片进行的,不是猝发模式。PCI设备是映射到非缓冲存储器的,从PCI从设备的读是非缓冲存储器的读。导致的直接结果是,到PCI从设备的读是速度较慢的块模式的读,即在更早的读完成前,其他的读不是高性能的猝发式数据传输。因此,导致了这种情况:虽然设置和进行的是猝发模式读,但最大的数据“猝发”被限制成x86 CPU能够完成的没有高速缓冲的最大的存储器“单”读。即64位,4字节,2个PCI时钟,全字节使能。通常,这是一个64位读,使用指令MOVQ r64,mem来完成。因此,使用x86 CPU读PCI从设备可以获得的最大的读是64位,或是“双”数据段,而不是9052所提供的高性能的连续猝发式数据传输。
  对于从PC平台到PCI从设备写来说,是短猝发写,芯片组结构到目标设备的主存储器的猝发每次不能大于4个长字,也就不允许较大的猝发。猝发写要比猝发读的速度要快。猝发写的长度是读的4倍,减少了写操作的次数,节约了三个相应的读开始和结束周期,因此写速度要比读大约快4倍左右。
  据上面分析可知,PCI9052读写速度慢,主要是PC平台的原因造成的较小的短猝发。因此,要提高基于PC平台下PCI9052的读写速度,一方面要对PCI9052的进行优化设置;另一方面,主要是从PC平台着手进行优化,包括对系统的优化,以提高效率,和读写操作的优化,以实现较好的读写时序。
  二、读写操作优化
  1.系统优化
  在进行PCI从设备操作时,尽可能减少其它进程的活动,尽量使系统时间用于PCI从设备的操作,减少访问空闲,提高系统对PCI从设备的访问时效。同时,尽量减少多个PCI从设备同时使用,避免多个PCI从设备分享PCI资源。在这一方面,LIUNX操作系统的效率要高于WINDOWS操作系统。
  PC平台的硬件方面,资源和性能配置尽量提高,特别是要有较大内存空间,避免经常性的读写速度较慢的硬盘。
  2.读写优化
  (1)读模式优化
  设置PCI 9052为Read Ahead Mode(预读取模式),CNTRL置1。PCI 9052支持直接从预读模式,数据读取是从PCI 9052内部FIFO读。地址必需是前面连续的地址的并发,且是32位数据(下一个地址是当前地址+4)。预读取模式要求在用于预读模式的存储器映射空间的LASxBRD寄存器设置预取允许,PCI 9052就每一个I/O映射访问刷新它的读FIFO。同时,设置为零等待状态,这样可以使PCI9052的读加倍,实现8~10Mbytes/s的读速度。
  (2)其他读优化
  分析可知,PCI从设备的存储器映射为非缓冲存储器。可设置PCI从设备的存储器映射为可缓冲,则当PCI从设备被CPU执行单元读时,这时缓冲单元在是完全的缓冲通道。对于连续地址是可以这样做的。在 x86 高速缓冲通道大小(每线64字节)或是16个PCI数据传送时钟下,结果是“猝发”的。但在从同一地址传送之前,必须刷新CPU高速缓冲,标志存储器为直接写,可以得到64字节的读,但当重复从同一地址读时,必须刷新全部的CPU高速缓冲,会导致以较大的猝发实现的失败,甚至系统崩溃。这样通常对系统是有害的。而系统分配给PCI地址后,就是固定的,也就必须完成上述的刷新全部的CPU高速缓冲的操作。
  另外,允许执行WBINVD高速缓冲刷新指令时获得的操作系统接口,是一个解决途径。WBINVD是个初始化指令,先擦除内部Cache,并分配一个专用总线周期将外部Cache的内容写回主存,在此后的一个总线周期内将外部Cache刷新。
  (3)写优化
  A:使用具有许多写缓冲的芯片组,可以将到线性连续地址的连续写组合成单个猝发。B:循环中使用MOVQ mem,m64指令,不用REP movsd指令。x86结构CPU的4长字的写的性能接近50MB/s。C:把设备存储器映射为USWC(无缓冲随机联合写操作)。USWC把每一个小的写入操作联合成一个64位写命令,再发到线性缓冲区,这样能够减少写操作次数,提高写速度。
  三、实验结果
  利用本文提出的方法,对一款PCI卡进行了优化测试试验,该卡采用DSP6204数字处理器,内部处理速度与数据传送带宽远大于PCI总线的速度,在这一方面不存在影响PCI总线与PCI9052之间的数据传送速度的因素。我们采用预读取模式,在LINUX下可实现12MB/s的读速度和28MB/s的写速度。在WINDOWS 2000下,采用预读取模式和USWC,可实现11MB/s的读速度和30MB/s的写速度。从实验结果得知,LIUNX下的读速度要比WINDOWS2000下的读速度要快一些,这是由于系统效率问题的区别,而WINDOWS2000下的写速度要比LINUX下要快一些,这是由于采用了设备存储器映射为USWC。
  四、结束语
  本文从PC平台对PCI设备的访问机制出发,从根本上分析了在PC平台下,PCI接口芯片PCI 9052读写速度慢的原因,并给出了相应的优化方法及实验结果。由于PC平台对PCI从设备访问机制的原因,这些优化不会从根本上得到大幅度提高,也不可能达到PC平台及PCI9052所提供的133MB/S的数据传送速率。如果有更高的数据交换速度的要求,只能使用象PCI9054这样可以进行DMA传送的价位较高的接口芯片。
  
  参考文献:
  [1]PLX Technology Inc.PCI 9052 Data Book[M].2.0 2001
  [2]Intel Corporation.IA-32 Intel Architecture Software Devel-oper’s Manual Volume 2:Instruction Set Reference[M/OL].1999[2006-05-08].http://www.intel.com/Order Number 245471-012
  [3]孙德文:微型计算机技术[M].北京:高等教育出版社,2004
其他文献
[摘 要] 2008年北京奥运会不仅蕴含着巨大商机,而且将对我国的经济、文化、环境和社会等方面产生一系列影响,可以说奥运会给一国的经济带来前所未有的活力。体育产业是体育发展的必经之路,理当顺应经济发展的客观要求,我们要抓住机遇,更新观念,改革体制,借08北京奥运的契机,推动我国体育产业的腾飞。  [关键词] 奥运经济 体育产业化 体育人才    长期以来,在计划经济的管理体制下我国体育事业管理基本
期刊
[摘 要] 企业是一个权力的集合,如何协调企业内部的各种权力关系对于追求内部和谐从而实现利润最大化的企业来说尤为重要。本文从权力的内涵出发,分析企业内权力的来源,并得出要构建企业权力和谐必须正确处理人力资本与物质资本关系的结论。  [关键词] 权力和谐 人力资本 物质资本    一、权力与和谐  1.权力的定义  Stephen P Robbins 从组织行为学角度详细阐述了权力的定义①:权力是指
期刊
[摘 要] 本文借鉴城市形象的CIS系统,结合理念形象和营销形象,以曲麻莱县生态移民村“昆仑玛尼石”为例进行形象定位,主张旅游纪念品开发应融入文化内涵,作全面形象定位。  [关键词] 形象定位 营销 旅游产品    一、曲麻莱县生态移民村简介及现有的玛尼石销售现状  为改善长江源头地区日趋严峻的生态环境,政府对长江源地区开始实施生态移民,动员牧民志愿放弃传统的生产、生活方式,搬迁到城镇居住,逐步恢
期刊
[提 要] 劳务派遣,原本是企业针对生产经营过程中临时性、短期性、不确定性的岗位采取的替代性用工方式。它满足了一些用人单位和劳动者建立灵活的劳动关系的需求,这原本无可厚非。但是,由于人们对劳务派遣缺乏正确理解,致使劳务派遣畸形发展,相当一些企业有意无意地利用这一形式,肆意侵害劳动者的合法权益,而且这一现象日趋严重。  [关键词] 劳务派遣 劳务派遣协议 劳动合同    一、劳务派遣概述  劳务派遣
期刊
[摘 要] 本文以浙江工商职业技术学院为例,首先研究了校园电子商务的必要性和可行性,然后对校园电子商务市场进行分析,最后从总体发展策略、员工组成、商品规划、推广方案和付款方式等方面对校园电子商务模式进行了探讨。  [关键词] 电子商务 校园电子商务 电子商务模式    2006年12月,浙江工商职业技术学院的校园网上开放了一个电子商务网站——GG购物网。该网站主要有网上店铺和二手商店组成,部分的在
期刊
[摘 要] 通过对奥运与体育旅游的关系分析,认为2008年北京奥运会能促进中国体育旅游业的快速发展,有利于投资环境的改善,扩大就业机会,带动产业结构的调整和社会经济的协调发展。并为2008年奥运会对四川体育旅游业的发展要求提供策略,促进体育旅游持续、稳定、健康的发展。   [关键词] 2008奥运会 体育旅游 影响    一、2008年北京奥运会对中国体育旅游业的影响   1.促进国民经济的增长
期刊
[摘 要] 本文利用中国29个省、市、自治区和直辖市从1986年~2006年的相应数据,将FDI和国内R&D的作为影响经济增长的重要因素,纳入经过改造后的巴罗的领导者——跟随者模型,构建出技术进步促进的经济增长模型。计量结果表明FDI促进了中国技术进步,而且FDI对东、中、西部的经济增长效应递减。  [关键词] FDI R&D活动 技术进步 经济增长    一、FDI技术外溢、R&D活动与经济增长
期刊
[摘 要] 建设社会主义新农村离不开金融的支持,目前我国的农村金融体系及服务已不适于社会主义新农村建设。本文以河南省为例,在通过分析金融支持社会主义新农村建设内在逻辑、作用机制、现状和存在的问题的基础上,提出了相应的金融支持措施。  [关键词] 社会主义新农村 建设 金融支持 措施    一、 金融支持社会主义新农村建设内在逻辑及作用机制  1.金融支持社会主义新农村建设内在逻辑  (1)金融发展
期刊
在全球经济一体化、金融一体化步伐越来越快的今天,各国综合国力的竞争越来越集中于人才的竞争,特别是创新型人才的竞争。如何培养创新型人才,传统的教育教学方式已无法适应,新的成熟的培养模式还未出现,但就金融学专业来说,循序渐进地做好如下三方面的工作对创新型人才的培养是非常重要的。  一、培养学生的思考习惯,形成良好的思考氛围  金融学专业是一门应用性很强的学科,它的理论方法与操作技能也随着国内外金融实际
期刊
[摘 要] 构建教育技术应用平台是有效管理与建设网络教学资源的必需,是推进财经院校信息化发展的关键。本文以广西财经学院为例,论述了财经类院校教育技术应用的特点、范畴、优化策略,以及教育技术应用平台的架构等问题。  [关键词] 财经类院校 教育技术 应用平台 构建    一、财经类院校教育技术应用的特点  财经类院校在以前主要以手工模拟的实验室为主,现在随着计算机网络应用的普及,许多行业、部门都使用
期刊