嵌入式高精度浮点协处理器设计

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：ie286

【摘要】

：

浮点运算是高精度的运算方式，主要应用在科学和多媒体计算中。浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标。相对于定点运算来说，不具备浮点运算单元的主CPIJ

【作者】

：

张鑫

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2008年期

【关键词】

：

浮点运算嵌入式高性能浮点协处理器

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

浮点运算是高精度的运算方式，主要应用在科学和多媒体计算中。浮点运算能力是关系到CPU的多媒体、3D图形处理的一个重要指标。相对于定点运算来说，不具备浮点运算单元的主CPIJ所从事的浮点运算，都是在许可范围内尽可能逼近的近似值。随着多媒体和互联网的高速发展，更高性能的精确计算对嵌入式CPU的浮点运算能力提出更高的要求。虽然一些软件库被开发出来暂时解决浮点计算问题，但是软件级别的模拟速度较慢，不能满足一些嵌入式系统的实时性要求，因此需要设计一种硬件结构来满足嵌入式领域的浮点运算需求。本文给出一种兼容IEEE754标准的嵌入式高性能浮点协处理器--VFP的设计与实现方法。该协处理器通过主处理器提供的外部协处理器接口同主处理器连接，支持浮点标量和向量操作，能够通过硬件高速执行符合IEEE754标准单精度、双精度的加、减、乘、除、乘加、平方根等运算，支持从浮点到整字的转换，具有分立的64位高带宽的load/store总线。使用该协处理器的嵌入式协处理器可以得到多方面的性能提高：VFP可以在浮点运算方面提高汽车的性能，包括在对精确性和可预测性要求较高的机械传动和车体控制应用，汽车中的机械传动、ABS系统、牵引控制、灵活性背负系统等关键应用；图像应用如比例缩放、印刷中的字形产生、3D转换、FFT、图形过滤等；下一代消费产品如网络应用产品、网关和机项盒可以直接受益于VFP，等等。该协处理器使用自顶向下的基于系统级算法的快速成型设计流程。首先确定系统的设计目标和关键性能参数。然后在系统级设计阶段确定系统流水线划分和各运算实现算法，并进行有效性评估及优化。进一步在RTL级设计通过改变底层实现进行性能优化。最终得到符合要求的设计。本设计着眼于嵌入式的应用领域，力求做到性能和功耗、面积代价的权衡。该设计的技术特点如下：数据通路上，使用改进的浮点乘累加数据通路和浮点单/双精度乘法的舍入方法，提供完全真正意义上的符合IEEE754舍入标准的乘累加运算，缩短了流水线关键路径，减少芯片面积代价。使用改进的恒定周期的迭代算法实现了除法和开方的复用设计，减少了面积代价，降低了系统功耗。使用分立的Load/Store总线和主处理器交换数据，去除了影响系统数据吞吐率的性能瓶颈。流水线技术上，使用共发射的两条独立数据处理流水线。使用适合嵌入式设计的简化的记分牌技术来解决系统的数据和资源冲突，实现不同流水线指令的乱序执行。使用提交队列保证指令的顺序提交。使用缓冲队列减少寄存器堆的端口，使用分立迭代单元的方法实现浮点向量迭代运算操作。使用预测技术实现适合嵌入式的非精确浮点异常处理，给出完全符合IEEE754标准规定的异常处理结果。本文的创新之处在于使用改进的浮点乘累加数据通路和浮点单/双精度乘法的舍入方法，提供完全真正意义上的符合IEEE754.舍入标准的乘累加运算，缩短了流水线关键路径，减少芯片面积代价。使用改进的恒定周期的迭代算法实现了除法和开方的复用设计，减少了面积代价，降低了系统功耗。使用缓冲队列减少寄存器堆的端口。设计采用TSMC.13工艺进行RTL综合，系统时钟达到300Mhz，面积约为10万门，满足预定的设计要求。可以作为独立的IP用于SOC设计。该设计被国内知名公司采用，具有很高的实际商用价值。

其他文献

用于极化分集系统的双圆极化天线设计

无线通信技术的迅猛发展,频谱资源的日益紧张,使通信系统面临越来越严峻的挑战,同时也对天线提出了越来越高的要求。为了提升系统容量,提高频谱利用率,人们提出了极化分集技

学位

双圆极化极化分集L型探针共面波导

一种基于空间相关性无线传感器网络分簇协议的研究与仿真实现

无线传感器网络(wireless sensor networks,WSN)是由密集分布在监控区域内的大量廉价智能传感器节点构成,通过无线通信方式形成一个多跳的自组织的网络系统。由于其能够获取

学位

无线传感器网络空间相关分簇能量有效网络仿真NS-2

一种适用于产品防伪的数字水印系统设计与实现

自1993年数字水印的概念被提出后,数字水印技术日益成为了一个非常活跃的研究领域,被广泛应用到广播监视、所有者鉴别、所有权验证、操作跟踪、内容认证、拷贝控制和设备控制

学位

数字水印产品包装DSPHVSDCT

基于衬底驱动技术的超低压、超低功耗CMOS模拟集成电路设计

随着无线通信设备、笔记本电脑、消费类电子和可移植医疗设备市场的不断扩大，极低电压工作环境下的芯片研发日益受到关注。因此，超低压、超低功耗模拟集成电路设计已经成为IC设

学位

CMOS模拟集成电路集成电路设计衬底驱动技

CDMA系统中基于恒模特性的盲波束形成算法研究

智能天线技术是目前通信和信号处理等领域的研究热点,自适应波束形成算法的研究是智能天线的一个关键技术,它能够自适应地控制天线阵方向图在用户信号方向产生高增益窄波束,

学位

智能天线盲波束形成码滤波方法恒模算法最小二乘法

浅谈文综开放性测试

本文通过对荣华二采区10

期刊

基于掌纹和手形特征融合的多生物特征识别算法研究

伴随着当今社会智能化、信息化和网络化的发展，人们对信息安全的要求也越来越高。个人身份鉴别已经成为国家安全、公安、金融、商业和人们日常生活中不可缺少的重要手段和环节

学位

信息安全身份鉴别掌纹手形特征多生物特征模式识别

RFID标签天线及射频前端关键电路研究

射频识别技术(RFID, Radio Frequency Identification)是一种非接触式的自动识别技术.利用无线射频信号在阅读器与电子标签之间进行双向数据传输以实现目标识别和信息交换。

学位

射频识别半有源标签标签天线阅读器射频前端关键电路

活性氧调控采后病原真菌致病力和生物拮抗菌生活力的机制研究

活性氧(ROS)在果实采后生防系统中发挥着重要的作用。在该系统中，寄主果实、病原菌、生物拮抗菌和环境因子构成了相互作用的四角关系。抑制病原菌致病力，增强生物拮抗菌生活力

学位

活性氧采后病原真菌生物拮抗菌逆境应答机制致病力

正六边形CuSe纳米片的制备与研究

纳米材料的出现，引起了材料领域乃至整个科学领域的极大关注。其表面电子和晶体结构与宏观物体相比发生了巨大变化，产生了纳米材料独有的四大效应:表面效应、小尺寸效应、量子

学位

正六边形硒化铜纳米片水热法聚乙烯吡咯烷酮氢氧化钠光催化性能

嵌入式高精度浮点协处理器设计

与本文相关的学术论文