余数系统及概率计算在矩阵乘法中的应用研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:zcskill
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在现代应用如神经网络、图像处理和信号处理中存在着大量的矩阵运算,这些应用给社会生活带来了极大的便利的同时,也对现代设备带来了挑战。在某些实时处理应用中,需要在提升运算速度的同时平衡面积开销和功耗,因此,余数系统(Residue Number Systems,RNS)作为一个高并行度的数值表征系统,可以在这些系统中用于加快矩阵乘法的运算速度。而在移动设备等对面积和功耗比较敏感,对运算时间和精度要求不高的应用中,概率计算(Stochastic Calculations,SC)作为另一种数值表征系统可以对这种应用在面积和功耗方面进行优化。本文介绍了余数系统的基本原理及结构,选取了适合的余数基,并对余数系统中关键单元进行了优化。后向转换单元(Residue To Binary,RTB)的作用是将余数系统下的数转换到二进制下的数,是余数系统的关键单元,也是余数系统中延迟最大、面积开销最多的单元。本文在中国剩余定理(Chinese Remainder Theorem,CRT)的基础上,将目标数拆分为高位和低位进行计算,最终消除了后向转换单元中的乘法器。在Design Compiler(DC)中综合对比后可得,优化后的余数系统后向转换单元与传统方法相比,面积减少了52.56%,关键延迟缩短了47.87%,功耗降低了59.20%。在概率计算中,本文使用了改进的共享随机数序列发生器的概率序列产生器(Stochastic Number Generators,SNG),该方法在不增加概率之间相关度的情况下将随机序列发生器的数量减少了一半。为了解决多个概率序列相加精度较低的问题,本文使用了近似累加器(Approximate Parallel Counter,APC),这种累加器利用或门和与门相互补偿的特性来增加计算精度。结合上面两种方法可以将随机序列发生器的数量减少到1个。在DC的综合结果中可以看到,最终经过概率计算优化后的数量积单元,相比未经优化的单元,其面积减少了90.07%,功耗降低了91.41%。最后,本文分别使用余数系统与概率计算对矩阵乘法器进行了优化。对结果进行了仿真验证和在FPGA上进行了硬件验证,并使用Design Compiler对结果给进行了综合,最终与未优化的矩阵乘法器相比,采用余数系统优化的面积减少了26.21%,关键路径的延迟缩短了50.03%,采用概率计算优化的面积减少了93.14%,功耗降低了77.33%。
其他文献
现如今,随着科技的快速发展,持久性内存逐渐进入大众视野。持久性内存同时具有读写快速,可按字节随机寻址,断电不会丢失数据的多重优点,填补了传统内存与外存之间在读写速度上呈现的巨大差异,有望成为新一代存储介质。持久性内存这些优秀的特性,同时给文件系统的设计带来了很多挑战。首先,目前主流的文件系统大多是基于磁盘的实现,在操作系统底层(块设备层)和页缓存(page cache)中的软件设计不能够完全贴合持
森林冠层的聚集度指数反映了冠层叶片偏离随机分布的程度,是描述冠层内部辐射传输过程的重要指标,而间隙率直接表征了辐射在冠层中的空间分布,是聚集度指数反演模型中不可或缺的冠层结构参数。近年来,随着激光雷达技术的发展,地基激光雷达以三维点云数据集的形式获取大量高分辨率的空间样本,被广泛应用于冠层结构参数的反演。Monte Carlo模拟可以避免复杂的数学运算,通过大量的随机抽样试验来估算问题的近似解。为
井中雷达是一种高效的、无损的井中探测手段,能够工作在油田、气井等深层地层,因此得到了广泛的应用。井中雷达由于环境的复杂性以及探测条件的限制,在实际地质探测过程中井中雷达相较于常规的探地雷达,更难保证数据质量,因此如何从井中雷达数据中提取出有效信息,并且从中反映的地层信息,是目前国际竞相研究的重点。井中雷达系统尚未有统一的国际化标准,因此,井中雷达数据因其数据传输复杂、数据量传输速度有限、数据容易因
在地震勘探中,地震层位解释是地震解释的基础工作,而层位的识别和追踪是地震层位解释的一个很重要的环节。相对地质年代(RGT)作为识别和追踪地震层位的一种方式,对于地震层位追踪和沉积学解释至关重要。传统生成RGT的方法主要是由人工手动的识别尽可能多的层位,继而对识别到的层位进行插值来获得。这种方法虽然直接,但是精度不高,并且严重依赖主观经验。为了解决上述问题,开发出具有更优越性能的RGT构建技术,相位
地震反射模式研究主要是通过不同地震反射信号的区别,使反射元得到正确的模式指派,从而获取目标层位岩性、流体和地层沉积的信息。传统的地震反射模式研究都是基于叠后地震数据,但叠加处理损失了地层中许多重要的细节信息。因此,本文利用叠前地震数据进行地震反射模式研究。在实际的油气勘探过程中,测井信息、标签样本获取困难,常规方法获取的标签数据远远不能满足用于解决复杂地质构造油气藏勘探开发中智能算法的需求;其次,
随着数字化产业的发展,图像处理技术融入日常生活的方方面面,图像增强作为图像处理重要的一环成为人们研究的重点。图像处理技术中的数据量巨大,使用加权二进制实现图像处理系统难以满足面积、功耗和性能的全面要求。随机计算作为一种无权重的数值表征系统,具有低功耗、低面积开销和高容错性等特点,可以使用简单的逻辑电路实现加权二进制系统中非常复杂的运算,非常适用于图像处理系统。然而,随机计算系统存在转换电路资源消耗
在认知无线电的背景下,NC-OFDM通信系统成为了最具有发展前景的通信体制,它不仅具有传统OFDM通信系统的优点,还具有整合非连续频谱资源进行数据传输的特点,这也使其成为一种有效的抗干扰手段。本文重点研究了NC-OFDM系统中的同步技术,为了在干扰环境中部分子带可用时仍能够进行正常的数据传输,提出了一种基于非连续ZC序列的同步算法,并基于NI-USRP平台采用Lab VIEW FPGA编程方式进行
随着无人机的广泛应用,在复杂的环境中作业已经成为一种趋势,导航是无人机作业的基础。然而,单一组合导航的方式已经不能满足无人机在复杂环境中自主、可靠、高精度的导航。为了提高无人机在复杂环境中导航的精确性,本文设计一种基于联邦卡尔曼滤波的多传感器融合导航系统。同时为了提高无人机在复杂环境中导航的可靠性,本文设计了基于传感器故障检测的容错导航。本文的主要研究内容如下:(1)针对在复杂环境中传感器干扰问题
精神分裂症(Schizophrenia,SCZ),是一种复杂的精神疾病,全球发病率约1%,核心症状表现为情感、思维和行为的障碍,其致残致死率高,给患者自身、家庭及社会均造成了严重不良影响。然而,目前对精神分裂症的诊断和治疗主要依靠临床医师通过患者的体征和症状进行主观判断,缺乏生物标记物来进行客观评估,这严重阻碍了精神分裂症的预防和临床诊疗。因此,研究SCZ的发病机制和寻找客观的生物学标记对于诊断及
目标跟踪是机器视觉研究领域的一个分支,具有十分重要的应用价值。目标跟踪算法能够根据已有的目标初始信息,在视频中对目标位置进行预测,对精度和速度有着十分严苛的要求。但是在实际的算法研究中,精度高与速度快这两种属性往往不能够同时满足。基于此,需要兼顾算法效率与实施平台结构等特性,对目标跟踪算法的性能进行权衡。本文旨在研究基于最小输出均方误差和(MOSSE)相关滤波目标跟踪算法的优化,以及其目标跟踪系统