超越函数加速器的算法设计实现

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:yrz315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据和人工智能的发展,对于芯片运算能力的要求越来越高。诸如三角、反三角、对数、指数等超越函数运算在实际应用十分常见。这些超越函数运算比加法和乘法运算更加复杂,使用软件算法运算的延时较高,难以满足数据密集型、速度关键型以及实时性应用的要求。因此,需要设计专用电路单元来加速这些常见的超越函数的运算。本文的主要工作包括:1.完成了正弦和余弦函数单元的算法研究与设计实现。基于泰勒定理和分段二阶多项式逼近方法,完成了正弦和余弦函数运算的算法设计。更进一步的,根据算法完成了结构设计以及信号位宽的设计与优化,并进行了仿真验证。仿真结果表明,正弦和余弦函数单元运算结果与准确结果之间的误差小于1 ULP(unit in the last place)且不存在单调性违例,所需的硬件成本与同类运算单元接近。2.完成了反正切函数单元的算法研究与设计实现。通过研究四象限反正切运算的算法,提取了算法的两个关键运算步骤,即象限运算和二象限反正切运算。更进一步的,完成了二象限反正切运算的算法设计,并根据算法完成了硬件结构设计,对设计的硬件结构进行了仿真验证。仿真结果表明,设计的反正切函数单元的运算结果与准确结果之间的误差小于1 ULP;运算输出随输入的增大而逐步增大,不存在单调性违例;且所需的硬件成本低于同类运算单元。3.完成了对数、指数、除法和开根四种辅助函数的算法研究与硬件结构设计,并进行了仿真验证。仿真结果表明,所设计的运算单元执行所述四类运算得到的运算结果与准确结果之间的误差皆小于1 ULP,达到了设计的精度要求。4.完成了超越函数加速器(Transcendental Acceleration Unit,TAU)的设计和实现。通过对各类运算单元的算法与结构的特征进行分析,设计了可用于完成本文所述各类函数运算的TAU的结构,并对其进行了流水线的划分以及综合优化与物理实现。研究结果表明,TAU的所有运算功能达到了设计的精度要求(运算结果的误差不大于1 ULP),且消除了基于分段二阶多项式逼近方法的正弦、余弦以及反正切运算算法的单调性违例。布局布线的结果表明,TAU的面积为1,201,108μm,工作频率可达100 MHz。
其他文献
学位
学位
学位
学位
学位
盘式永磁电机也称轴向磁通永磁电机,相比于传统圆筒永磁电机,具有轴向尺寸短、结构简单、功率密度高等优点。该电机广泛用于风力发电、飞轮储轮、电动汽车、航空航天等空间狭窄的应用场合。但在一些要求严格的工作环境中,对盘式永磁电机反电动势波形的正弦度及重量有更高的要求。本文主要基于单转子有铁芯盘式永磁电机进行包括电磁设计及仿真建模、削弱反电动势波形谐波以及提出一种可减少电机重量的轻量化设计等方面的研究。(1
数学具有突出的抽象性、思维性与深奥性等特点,因而只有初中生具有良好的自主学习能力,教师与同学的热心帮助与思维启迪才会产生真正的实际效果。在核心素养的强力推动下,教师开始反思数学课堂的教学过程,主动谋求高效化、主体化、探究化的科学构建策略,自觉践行生本理念与科学育人观。因此,教师纷纷为初中生的信息获取、知识解读与能力提升创设有设计、有目标、有过程、有效果的主体认知过程,切实促进初中生自主学习能力的培
期刊
自1958年安德森在无序系统中发现金属-绝缘体转变以来,低维量子系统中波函数的局域化问题引发科学界的大量关注,并在实验和理论方面展开深入研究。一维准周期系统中,Harper链同样可发生类似于三维无序系统中的金属-绝缘体转变。近年来,众多学者纷纷研究无序-有序耦合链、准周期耦合双链或多链系统中电子的局域化转变和迁移率边,而这些研究罕有探究链间耦合作用对耦合系统电子性质的影响。在本文中,我们研究非周期
学位
学位