【摘 要】
:
当前对计算系统高效性和灵活性的需求日益增加。可重构处理器兼具专用集成电路的运算高效性与通用处理器的编程灵活性,近年来受到了广泛关注。细粒度可重构结构(Fine-Grained Reconfigurable Architecture,FGRA)在比特级进行配置,具有良好的配置灵活性。粗粒度可重构结构(Coarse-Grained Reconfigurable Architecture,CGRA)由大
论文部分内容阅读
当前对计算系统高效性和灵活性的需求日益增加。可重构处理器兼具专用集成电路的运算高效性与通用处理器的编程灵活性,近年来受到了广泛关注。细粒度可重构结构(Fine-Grained Reconfigurable Architecture,FGRA)在比特级进行配置,具有良好的配置灵活性。粗粒度可重构结构(Coarse-Grained Reconfigurable Architecture,CGRA)由大量的功能单元(Functional Unit,FU)互连组成,FU支持常见的字级操作,CGRA在加速高吞吐量应用程序时具有更高的性能。混合粒度可重构架构结合了FGRA和CGRA的优点,是未来处理计算密集型应用的理想平台。本论文针对混合粒度可重构架构,提出了一种支持细粒度计算和多个可重构处理单元(Reconfigurable Processing Unit,RPU)并行执行的编程语言扩展方案并实现了编译器前端。为充分利用该架构中不同粒度的可重构资源和粗粒度可重构阵列的多RPU资源,在编译器前端添加细粒度关键字并提供FGRA编程接口;通过指定RPU执行及异步调用方式实现多RPU并行执行。为充分利用可执行资源,本文根据架构特点和计算模型,提出了三种面向不同应用场景的并行性相关编程语法,简化了程序员的编程工作,提高了编程效率。对于不同模块的代码,用关键字进行标记,基于Clang编译框架添加语法支持。编译器前端以扩展后的编程语言编写的程序作为输入,当编译器识别到关键字时自动提取被标记的并行代码段,将其表示为特定形式的中间表示语言提供给编译器后端做后续处理。本论文对该编程语言扩展方案及编译器前端进行了功能验证和性能分析。从FGRA接口功能验证、指定RPU调用功能验证、粗粒度多任务功能验证这三个方面来验证编译器前端的功能正确性。对具有上述功能的源程序,编译器前端对其进行编译并生成正确的中间表示。本文采用典型的计算密集型应用评估性能,用所开发的编译器进行编译。结果显示,相较于通用处理器,对于不同应用CGRA获得了553倍的性能加速。实验结果验证了本文编译器前端的功能正确性,证明了该编程语言扩展方案和编译器前端设计方案的可行性与合理性。
其他文献
激光散斑成像技术是一种针对血管中血流的成像与特性分析的强有力的方法。对粗糙表面或含有散射物质的介质的激光散斑图案进行时空域的统计学分析,可以得到高精度的粗糙表面图像和介质相对流速分布等数据。将激光散斑技术运用于人体内细小血管的检测,具有重大的学术价值和临床实践意义。本文首先对空间与时域的激光散斑衬比度算法理论进行推导,建立了应用于细小血管的激光散斑图像提取程序,搭建了利用激光散斑技术进行细小血管血
得益于近年来技术的进步,具有自主建图与导航能力的无人系统在各个行业及领域中都得到了广泛的运用。但现有的建图导航技术依旧高度依赖机载的实时算力,这与当下实际应用中普遍的装备小型化要求相矛盾。此外,如今常见的几何结构的地图对环境的抽象表达能力十分欠缺,这导致了负载有限的轻量化无人系统平台仍难以实现较高层次的智能。针对这些问题,本文从拓扑形式组织全局地图的技术路线出发,设计了基于多假设法的拓扑地图鲁棒快
由于护照属于保密品,涉及很多防伪技术,运用了具有防伪功能的荧光线进行缝纫装订。经过缝纫装订后的护照成品,缝纫线线迹排列紧密,目前没有一种合适的护照缝纫线提取方法来检测护照装订质量。而本论文通过实验,结合已有的图像处理研究成果,分析与比较各处理方法的优势与客观应用条件,利用Matlab软件,运用空间域局部同态滤波、灰度拉伸、巴特沃兹滤波等技术,解决了图像处理过程中细节丢失现象,提取了边缘轮廓锐利并且
随着数字医学技术的不断发展,辅助手术导航系统已经得到了大量的临床应用。然而,国内现有手术导航系统定位方式以光学导航为主,应用场景单一,且光学导航存在光学遮挡问题,导致定位手术器械不可见,并降低手术连续性。另外,在临床手术中,医生还面临着高难度手术中强迫体位多、定位精度要求高与手术时间长等难题。针对以上临床难点,本文将电磁定位应用于动态导航中,研发了基于动态图像引导的电磁手术导航系统。本文的主要研究
随着办公信息化的快速发展,各种信息系统逐渐普及以提高企业经营活动的效率。工作流技术作为流程管理的中间件技术,在办公软件领域扮演着重要的角色。然而在现实业务流程快速变更的情况下,工作流产品预制的功能往往无法满足企业的需要,例如无法实现任务的动态跳跃、回退操作。针对这种不足,对工作流技术领域进行了调查后,以开源软件Activiti5作为基础进行改造,使该框架具有自由选择下一个审批任务的能力,以增加该框
人眼的视线方向包含丰富的注意力信息以及潜在的大脑认知过程,视线估计就是研究如何估计人眼的视线方向和凝视目标,它可以广泛应用在临床研究,人机交互,教育等各个不同的领域。虽然已经有一些商业公司研发出视线估计的工程应用,然而大都非常依赖于特定的硬件设备,使用非常受限。在这种背景下,基于面貌的视线估计方法凭借简单的设备要求,快速的追踪速度越来越受到重视,深度学习在视线估计上的成功应用进一步促进了研究人员对
电阻抗断层成像(Electrical Impedance Tomography,EIT),是一种新兴的非植入性医疗成像技术,相比较于传统的医疗成像手段,它对人体无害且成本较低,适用于长时间连续监测,具有良好的临床应用前景。本文利用EIT传感器芯片设计开发出一套16电极的EIT实时监测系统。首先,开发出信号采集硬件电路并利用LabVIEW编程实现对EIT信号的采集和传输;然后,设计出基于快速傅里叶变
随着国内智能制造的发展,MES(Manufacturing Execution System)制造执行系统的要求越来越高,针对在一条复杂的离散型生产流水线上可能存在几十个工站和总成型号、不同工艺路径组合及数量庞大的原材料种类等问题,如何通过MES改进来提高生产效率,质量控制从而提升企业的竞争力具有相当大的实际运用价值。本文以X汽车零部件公司的生产业务为研究对象,介绍X公司的生产流程和MES概况,通
数据复制中心旨在解决企业面临的各类数据同步问题。常见的问题有:把线上数据同步到数据仓库供后续分析;实现变更数据捕获模式,订阅数据库变更以更新缓存、搜索引擎或是异步触发后续业务流程;在不同数据中心之间做双向同步以提供异地容灾能力等。业界也有一些解决这些问题的尝试,但公开的方案有些只是命令行工具,无法满足企业对可用性的要求;有些只支持特定的数据源,难以拓展到不同类型的数据源;大部分方案使用与源端相同的
S公司用SAP CRM系统处理产品信息、客户信息等主数据以及投诉、故障追踪单和报障单等业务数据。用户除了通过CRM网页客户端进行业务数据的操作,还通过外部应用及APIs与CRM中的业务数据作交互。由于CRM提供的业务数据搜索服务不能满足用户的需求,本文构建了一种新的搜索解决方案,关键是从底层将搜索由数据库搜索切换成SAP TREX搜索,形成一个新的SAP CRM搜索,通过该方案的实施改善企业内外部