论文部分内容阅读
莱迪思半导体公司日前宣布推出下一代LatticeECP4FPGA系列,由其重新定义了低成本,低功耗的中档FPGA市场,具有6 Gbps的SERDES采用低成本wire-bond封装,功能强大的DSP块和具有基于硬IP的通信引擎,适用于成本和功耗敏感的无线、有线、视频,和计算市场。LatticeECP4FPGA系列以LatticeECP3系列为基础,为主流客户提供高级功能,同时保持业界领先的低功耗和低成本。对于为各种应用开发主流平台,LatticeECP4器件是非常理想的,如远程无线射频头、分布式天线系统、蜂窝基站、以太网汇聚、交换、路由、工业网络、视频信号处理、视频传输和数据中心的计算。
高品质的SERDES和固化的通信引擎
LatticeECP4 FPGA包含多达16个符合CEI标准的6 Gbps SERDES通道,具有嵌入式物理编码子层(PCS)模块,采用低成本wirebonded封装和高性能flip chip封装,使客户能够选择以芯片到芯片以及远距离背板应用的方式部署LatticeECP4 FPGA。多功能和可配置的SERDES/PCS可以无缝地与固化的通信引擎相集成,经济地构建完整的高带宽子系统。通信引擎比用类似的FPGA实现减少10倍以上的功耗和成本。LatticeECP4通信引擎组合包括针对PCI Express2.1、多个10千兆以太网MAC和三速以太网MAC,以及串行快速I/O(SRIO)2.1的解决方案。SERDES/PCS和通信引擎的结合是完成基于复杂串行协议的设计的理想选择,具有较低的成本,功耗和小尺寸的特点,同时加快了产品的上市时间。
创新的DSP处理技术,减少了乘法器的数量
LatticeECP4系列具有功能强大的数字信号处理(DSP)模块,18×18乘法器、宽ALU、加法树,以及用于级联的进位链块。独特的加速逻辑意味着每个LatticeECP4 DSP模块可等于4个LatticeECP3 DSP模块,4倍于上一代LatticeECP3器件的信号处理能力。灵活的18×18乘法器可以分解成9×9或组合成36×36,以便完美的符合客户的应用需求。此外,多达576个乘法器可以级联在一起构成复杂的滤波器,用于无线远程射频头(RRH)、基于MIMO射频天线的解决方案,以及视频处理的应用。
更高的性能和容量
LatticeECP4 FPGA的速度比上一代器件快50%,具有1066 Mbps的DDR3存储器接口和1.25 Gbps的LVDS I/O,也可作为串行千兆以太网接口。新的LatticeECP4系列还有66%以上的逻辑资源和42%以上的嵌入式存储器,使设计工程师能够在FPGA中构造完整的片上系统。
莱迪思公司副总裁兼业务部总经理Sean Riley评价说:“下一代LatticeECP4 FPGA系列为我们的客户提供前所未有的高级功能、高性能,GFLOP的性能,从而不但可使DSP成为HPC的理想解决方案,而且还正改变着开发人员选择应用解决方案的方式。将于2012年提供样片的TCIC6609代码兼容于C6678 DSP,有助于开发人员重复使用现有软件,保护其对TI多核DSP的投资。
简化多核开发
TI拥有一系列高稳健多核软件、工具以及低成本评估板(EVM),不但可简化开发,而且还可帮助开发人员进一步发挥C66x多核DSP的全部性能优势。设计人员可采用TMDSEVM6678L启动C6678多核DSP的开发。该EVM包含免费多核软件开发套件(MCSDK)、CodeComposer Studio集成型开发环境(IDE)以及应用/演示代码套件,可帮助编程人员快速启动新平台开发。
推出基于TI高性能多核DSP的线性代数库
德州仪器与德州大学奥斯汀分校(UT Austin)成功将该校科学计算高密度线性代数库(libflame库)移植至TI TMS320C6678多核数字信号处理器(DSP),成为多内核创新的又一里程碑。该移植可带来所有libflame功能,能够为油气勘探、金融建模以及分子动力学等众多高性能计算(HPC)应用提供基本软件构件组块。这一成果不仅展示了C6678多核DSP可高效实施这些算法的基本特性,也展示了这些库移植至TI DSP的便捷性。TI C6678DSP具有业界领先的16 GFLOPs/W单精度性能,加上libflame等优化软件库,可为HPC市场带来超低功耗解决方案。
德州大学奥斯汀分校计算机科学教授及德克萨斯计算机工程科学研究院成员Robert van de Geijn指出:“我们可将libflame等重要科学计算库迅速移植至C6678多内核DSP,不仅充分说明了TI DSP具有极高的易用性,也证明了我们基于C语言的现代方法可开发线性代数库。”
高品质的SERDES和固化的通信引擎
LatticeECP4 FPGA包含多达16个符合CEI标准的6 Gbps SERDES通道,具有嵌入式物理编码子层(PCS)模块,采用低成本wirebonded封装和高性能flip chip封装,使客户能够选择以芯片到芯片以及远距离背板应用的方式部署LatticeECP4 FPGA。多功能和可配置的SERDES/PCS可以无缝地与固化的通信引擎相集成,经济地构建完整的高带宽子系统。通信引擎比用类似的FPGA实现减少10倍以上的功耗和成本。LatticeECP4通信引擎组合包括针对PCI Express2.1、多个10千兆以太网MAC和三速以太网MAC,以及串行快速I/O(SRIO)2.1的解决方案。SERDES/PCS和通信引擎的结合是完成基于复杂串行协议的设计的理想选择,具有较低的成本,功耗和小尺寸的特点,同时加快了产品的上市时间。
创新的DSP处理技术,减少了乘法器的数量
LatticeECP4系列具有功能强大的数字信号处理(DSP)模块,18×18乘法器、宽ALU、加法树,以及用于级联的进位链块。独特的加速逻辑意味着每个LatticeECP4 DSP模块可等于4个LatticeECP3 DSP模块,4倍于上一代LatticeECP3器件的信号处理能力。灵活的18×18乘法器可以分解成9×9或组合成36×36,以便完美的符合客户的应用需求。此外,多达576个乘法器可以级联在一起构成复杂的滤波器,用于无线远程射频头(RRH)、基于MIMO射频天线的解决方案,以及视频处理的应用。
更高的性能和容量
LatticeECP4 FPGA的速度比上一代器件快50%,具有1066 Mbps的DDR3存储器接口和1.25 Gbps的LVDS I/O,也可作为串行千兆以太网接口。新的LatticeECP4系列还有66%以上的逻辑资源和42%以上的嵌入式存储器,使设计工程师能够在FPGA中构造完整的片上系统。
莱迪思公司副总裁兼业务部总经理Sean Riley评价说:“下一代LatticeECP4 FPGA系列为我们的客户提供前所未有的高级功能、高性能,GFLOP的性能,从而不但可使DSP成为HPC的理想解决方案,而且还正改变着开发人员选择应用解决方案的方式。将于2012年提供样片的TCIC6609代码兼容于C6678 DSP,有助于开发人员重复使用现有软件,保护其对TI多核DSP的投资。
简化多核开发
TI拥有一系列高稳健多核软件、工具以及低成本评估板(EVM),不但可简化开发,而且还可帮助开发人员进一步发挥C66x多核DSP的全部性能优势。设计人员可采用TMDSEVM6678L启动C6678多核DSP的开发。该EVM包含免费多核软件开发套件(MCSDK)、CodeComposer Studio集成型开发环境(IDE)以及应用/演示代码套件,可帮助编程人员快速启动新平台开发。
推出基于TI高性能多核DSP的线性代数库
德州仪器与德州大学奥斯汀分校(UT Austin)成功将该校科学计算高密度线性代数库(libflame库)移植至TI TMS320C6678多核数字信号处理器(DSP),成为多内核创新的又一里程碑。该移植可带来所有libflame功能,能够为油气勘探、金融建模以及分子动力学等众多高性能计算(HPC)应用提供基本软件构件组块。这一成果不仅展示了C6678多核DSP可高效实施这些算法的基本特性,也展示了这些库移植至TI DSP的便捷性。TI C6678DSP具有业界领先的16 GFLOPs/W单精度性能,加上libflame等优化软件库,可为HPC市场带来超低功耗解决方案。
德州大学奥斯汀分校计算机科学教授及德克萨斯计算机工程科学研究院成员Robert van de Geijn指出:“我们可将libflame等重要科学计算库迅速移植至C6678多内核DSP,不仅充分说明了TI DSP具有极高的易用性,也证明了我们基于C语言的现代方法可开发线性代数库。”