一般稀疏矩阵相乘的混合并行算法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:liongliong592
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏矩阵相乘广泛应用于科学和工程计算中,是科学计算中的一种常用的基本运算,其面临着数据量大,非零值分布不规则,负载难均衡,计算结果矩阵的列指数无规则分布等问题。通过矩阵分块,优化数据传输,负载均衡,改良并行快速排序方法来解决上述问题,提高了计算效率。在多线程下计算速度比商业软件Intel MKL(Intel math kernel library)平均提高56%。同时,还通过MPl+OpenMP进行混合并行优化,在共享存储系统上两者有类似的计算速度。
其他文献
5月31日,广东省东莞市中堂镇中联纸业有限公司发生火灾。起火建筑为中联纸业有限公司的造纸车间,着火部分为烘干部,烧毁的是烘干部部分线路、厂房屋顶隔热层,无人员伤亡。
隐私偏好平台(platform for privacy preferences,P3P)是现今世界上广泛使用的隐私策略语言之一,服务提供者通过P3P隐私策略来告知用户如何处理隐私信息。针对P3P隐私策略缺少形
劳动的二重性是马克思主义政治经济学的重要理论范畴,运用这一范畴认识有用劳动,合乎逻辑地可推导出对于有用劳动的具体性与抽象性的区分,即可确定抽象的有用劳动的概念存在,这种确定对于研究劳动价值理论具有重要意义
《财富》(中文版)于北京时间2016年7月13日发布了2016年中国500强排行榜。该排行榜覆盖范围包括在中国境内外上市的所有中国公司,所依据数据为上市公司在各证券交易所正式披露
近年来词袋(bag-of-words,BoW)模型因为其较高的性能而被人们认可。词袋模型的改进方法主要包括两种,一种是在图像特征表示中加入空间信息,另一种是加入语义信息。研究了结合图像特征点间的空间和语义信息的高性能图像特征表示方法,通过计算图像中视觉词间的分布距离,并提取相似的视觉词组成视觉短语,来更好地表示图像。在UIUC-Sports8图像库和Scene-15图像库上进行图像分类实验,并与传
为了从生物特征和统计角度来提高识别的性能,提出了一种基于血流图的离散余弦变换(discrete cosine transform,DCT)与特征选择相结合的人脸识别方法。该方法首先利用血流模型把红外温谱图转换成血流图,得到更具丰富频率的特征。其次,采用DCT变换可以有效地消除血流图的相关性。最后,在DCT域特征提取阶段,为了提高特征提取的有效性,特征选择和子空间学习基于一致的可分性目标:特征选择引
矩阵主特征向量(principal eigenvectors computing,PEC)的求解是科学与工程计算中的一个重要问题。随着图形处理单元通用计算(general-purpose computing on graphics pro cessing unit,GPGPU)的兴起,利用GPU来优化大规模稀疏矩阵的图形处理单元求解得到了广泛关注。分别从应用特征和GPU体系结构特征两方面分析了PE
文章认为,对城市贫困概念的界定是有争议的,但它也有一个相对稳定合理的内涵;城市贫困的原因是多方面的,既有经济体制改革的宏观社会背景,也有个人方面的微观原因。文章对城市贫困
债转股作为银企重组的一种重要方式,其目的不仅仅在于解决银行的不良债权和减轻国有企业的债务负担问题,而应着眼于现代企业制度的建立,特别是企业治理结构的完善与创新。本文认为,国有企业的改革应以债转股为契机,通过资产管理公司对企业治理的参与以及国有股权的最终退出,优化企业融资结构,实现企业投资主体多元化,从而构造以机构股东和法人持股为特征的企业治理结构的创新模式。
某些工业技术用纸板需要采用微涂或表面施胶处理,才能达到使用要求的高表面强度及其他性能指标,但在表面施胶过程中往往会出现纸幅两边黏附表面施胶液进而在后续工序形成胶块