【摘 要】
:
多数l_1最小化算法主要由稠密矩阵矢量乘(如Ax和A~Tx)和矢量运算组成.为使其适应大数据环境下的性能需求,基于GPU,利用其新的特征,提出了两个新颖的基于GPU的并行矩阵矢量乘.这
【基金项目】
:
国家自然科学基金资助项目(61379017)
论文部分内容阅读
多数l_1最小化算法主要由稠密矩阵矢量乘(如Ax和A~Tx)和矢量运算组成.为使其适应大数据环境下的性能需求,基于GPU,利用其新的特征,提出了两个新颖的基于GPU的并行矩阵矢量乘.这两个算法实现了全局内存的合并访问,对任意给定矩阵,通过所使用的自适应分配线程数或warp数的策略,增加了鲁棒性.基于这两个算法,并以两个流行的l_1最小化算法为例:快速迭代收缩阈值算法(FISTA)和增广拉格朗日乘子法(ALM),提出了两个高效基于GPU的并行l_1最小化算法.实验结果验证了提出的算法是高效的,并有良好的性能
其他文献
目的:探讨分析彩色多普勒超声诊断在四肢血管栓塞诊断中的准确性。方法:选取2018年-2020年收治的疑似四肢血管栓塞的患者78例,作为此次研究对象。结果:本组78例疑似四肢血管
采用CFD技术对空冷汽轮机低压末级进行全三维变工况设计,掌握了空冷机组末级动叶的变工况运行时的流动情况,对因高背压产生压力面流动分离进而引发颤振的机理有了一定了解.分
介绍了上海汽轮机有限公司空冷300MW汽轮机的主要技术特点,通过对结构、通流、轴系和差胀进行优化设计,确保机组运行的安全性厦其性能的先进性。目前该机组在市场上取得了良好
目的:制备N-软脂酰基壳聚糖叶酸靶向纳泡,观察和测定其基本特征。设计纳泡与活细胞共孵育装置,便于研究叶酸纳泡与叶酸受体高表达的细胞之间的相互作用。方法:高速剪切法制备