面向商密算法的专用指令集处理器研究与设计

来源 :浙江大学 | 被引量 : 0次 | 上传用户:cd21love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密码技术作为网络信息安全的核心技术和基础支撑,其重要性已经逐渐上升到国家战略层次。本世纪洎今,中国持续搭建自己的现代密码体系,公开商用密码算法并鼓励其研究开发和推广应用。而安全场景的不断多样化和复杂化,对密码算法的实时性、安全性和灵活性都提出了更高的要求。本文面向通用的安全应用场景,通过统计分析大量密码算法并归纳其典型特征,研究设计了一种适应密码算法的专用指令集处理器(Application Specific Instruction Set Processor,ASIP)架构,重点解决算法在数据调度和状态更新过程中的性能瓶颈。在此架构下,针对商密算法进行硬件设计、仿真验证和ASIC(Application Specific Integrated Circuit,专用集成电路)实现。论文的主要研究内容和特点如下:1.重点介绍了我国商用密码算法的算法原理、算法结构和运算种类,进一步统计分析主要密码算法,归纳得到密码算法的结构特征、数据特征和运算特征等典型特征。2.基于对密码算法数据特征的归纳分析,提出了反馈移位寄存器堆的编程模型。该编程模型着眼于密码算法流程中的数据流,统筹算法数据的存取方式和寄存数据的迭代更新方式,并实现了高效映射,在简化寄存器操作逻辑的同时,提升密码算法处理性能和代码密度,且具备良好的可扩展性。3.基于对密码算法结构特征的归纳分析,建立以迭代为核心的专用处理器架构。划分处理器执行级为内外两层迭代结构,实现算法数据的有序输入输出处理。根据操作数据的性质和功能差异,进一步将内部迭代划分为主迭代和协迭代两个并行的部分,并与反馈移位寄存器堆建立映射关系,同时根据运算种类和操作数据来源细分运算处理模块,优化计算顺序,从而实现算法数据的高效并行迭代处理。4.在上述架构的基础上,为了提升指令密度,提出具有高压缩特性的32位/16位混合编码的专用指令集。利用无需寄存器号索引的编码优势,将迭代指令和数据存取指令协同编码,从而提升数据流的连续性;将主迭代指令和协迭代指令并行编码,可以支持更加灵活的算法配置和指令操作。依据密码算法的数据特征统计结果设置指令编码各位段属性,最大化利用编码空间,可以兼容更多的密码算法。5.对专用处理器架构进行硬件实现,并在TSMC 28nm工艺下进行硬件综合和版图实现,占用了 42479 μm2的面积,等效门数101k。在1.5 GHz的工作频率下,SM3算法、SM4算法和ZUC算法分别取得了 11.13 Gbps、9.6 Gbps和4.8 Gbps的吞吐率,说明本文提出的专用指令集处理器可以满足实时性和灵活性的要求。
其他文献
河流作为水环境中的重要组成部分,在供给水源、维持生态、美化景观等诸多方面扮演着不可或缺的角色。但是,目前人类活动和自然因素导致河面频繁出现大量漂浮物,严重破坏了河道景观和水生态环境,已成为河道监管中重点关注的问题。在国内各省市全面推行落实“河长制”政策的背景下,很多地方开始采用摄像头进行河湖可视化监管以促进河湖面貌改善,但是人工参与程度依然较高,单纯依靠人力观看大量的监控资料来判断河湖状况。在这种
推荐系统的发展离不开大规模高质量的数据,多家相关企业往往会以数据直接共享的方式提升推荐系统效果。但随着用户数据隐私意识的提高和数据保护法规的完善,多方参与的推荐系统的数据隐私安全问题受到越来越多的关注。本文针对多方参与的推荐系统的数据隐私保护存在的问题,利用联邦学习技术提出了一种高效的基于纵向联邦学习的推荐系统,在提高多方参与的推荐系统数据隐私安全性的同时也极大的降低了引入隐私保护技术的代价。本文
作为中枢神经系统的核心,大脑是人类区别于其他物种的重要部分,而大脑发生异常或者病变会对人的基本生存能力造成重大影响甚至死亡。在大脑或者脊髓组织中产生病变细胞的疾病称为脑瘤,其患者五年生存率仅约为35%,但是脑内组织边界模糊,病变(异常)区域和正常组织难以界定。脑病变的判定以及病变区域的定位是进一步治疗和诊断的前提,然而医生去完成这些工作不仅仅需要丰富的行医经验和医学专业知识,而且还需要投入大量的时
对肺部病灶进行实时精确定位一直以来都是肺部疾病诊疗中的难题。由于肺部软组织会随着呼吸、心跳等干扰因素动态移动,传统基于CT静态影像或者体外标记物的定位方法只能给出病灶、血管、气管等重要组织在特定时刻的位置信息,难以获得精确的动态位置信息,这为肺肿瘤穿刺病理诊断和手术治疗带来了极大的困难。为解决些难题,本文针对呼吸运动下的肺部软组织目标跟踪问题展开研究,借助肺部动态X射线影像的实时观测数据,提出一种
在现代物流仓储场景中,快递包裹吞吐量日益增加,如何实现高效率的货物分拣成为现阶段仓储管理系统发展的重要目标。目前仓储场景中已基本实现摄像头的全覆盖,利用这些摄像头搭建人员全局定位跟踪系统有助于实现仓储场景内“人-货-场”的协同优化,提高分拣作业效率。然而,目前广泛使用的目标检测算法难以实现对仓储场景下被遮挡行人的检测,常用的多目标跟踪算法无法鲁棒跟踪仓储场景下着装统一的行人。针对上述问题,本文设计
指纹识别是应用最广泛的身份认证技术之一。随着移动终端集成度的增加和消费者对终端轻便性要求的不断增长,指纹传感器采集面积不断减小,从而导致了用于指纹匹配的有效信息减少;另一方面,移动终端上指纹的采集条件复杂多样,且诸如皮肤龟裂、污渍等不利条件会对指纹图像造成影响。因此,小面积低质量指纹识别技术不仅是一项具有广泛应用前景的身份认证技术,而且是一项迫切需要解决的技术难题。本文的研究聚焦于低质量小面积指纹
实时流数据作为高速连续到达的数据序列,在工业控制,实时监控,自动驾驶,信号处理等与嵌入式系统密切相关的领域广泛出现。随着嵌入式系统对实时流数据的处理性能要求越来越高,嵌入式系统上传统的实时流数据处理系统遇到了瓶颈,数据传输速度、实时性与数据处理带宽等方面的问题越来越突出。针对嵌入式系统对实时流数据进行处理时数据传输速度、实时性与数据处理带宽等方面的问题,本文给出并论述了一套基于VPX嵌入式系统的高
三维点云的语义分割是实现三维场景理解的基础和关键,准确的点云语义结果对于自动驾驶、工业检测及数字医疗等领域都具有重要的实际意义。随着实际应用场景越来越复杂,传统人工设计的特征算子陷入了瓶颈,而基于数据驱动的深度学习方法在语义分割的精度上有了巨大的提升,但仍然存在以下不足:基于单一视图的点云语义分割算法存在着局限性,导致难以达到性能与精度的平衡;点云的多视图融合虽然可以利用不同视图之间的差异性来提升
徽标(Logo)是代表企业形象的重要标志,正确和规范地使用Logo尤为重要。随着信息化的快速发展,办公文件数量与日俱增,海量办公文件中的Logo缺陷检测需求也随之增长,但传统的人工检测耗费人力、物力等大量资源,并且人工检测会因疲劳损耗导致Logo缺陷误检和漏检,因此自动化的Logo缺陷检测尤为重要。本文以实验室合作的软银SB C&S公司的Logo为主要研究对象,设计了基于图像处理的Logo缺陷检测
作为新兴的开源精简指令集,RISC-V在微处理器市场中的占有率逐年上升,由于其缺乏硬件层面的安全隔离机制,如何确保微处理器的安全性成为了亟需解决的问题。本论文针对RISC-V的安全性问题,对其做了以下改进:(1)与主流硬件隔离机制相似,将处理器的安全状态划分为安全世界与普通世界,将内存资源划分为安全区域与非安全区域,安全世界能访问安全区域和非安全区域,而普通世界只能访问非安全区域。(2)在本设计中