矩阵向量乘法相关论文
分布式计算是大规模机器学习和大数据分析的主流,但其性能通常受到不可预测的落后计算节点的严重影响。针对矩阵向量相乘这一众多......
近年来,卷积神经网络由于其超高的推理精度被广泛的应用于物体识别,语音处理与机器翻译的任务中。然而,随着卷积神经网络的模型变得越......
BLAS(Basic Linear Algebra Subprograms)定义了一组基本的矩阵和向量的操作,包括各种矩阵乘法和矩阵向量乘法,在许多领域有广泛的......
本文将阐述稀疏矩阵矩阵向量乘法几种的并行实现,以及实现中的计算复杂度和通信复杂度.通过在计算机机群ACI上的测试结果显示出算......
目前,大多数LDPC编码器采用的是FPGA实现,文中根据Richarson和Unbanke提出的有效编码算法,具体分析了基于该算法的编码器在DSPs上......
针对长短时记忆神经网络(Long Short-Term Memory, LSTM)模型计算开销大、冗余计算较多的问题,本文提出一种利用输入数据稀疏性的L......
提出了一种基于IEEE-754的32 bit、64 bit浮点数格式,二叉树数据流(binary tree data flow )的矩阵向量乘法器。其在FPGA上流水线和高......
计算机数值模拟是推动工业和科学发展的重要助力。随着计算机的发展,众核架构越来越成为高端系统的首要选择,例如目前世界上最快的......
计算机数值模拟是现代科学和技术发展的重要触发力量.在数值模拟中,求解大规模稀疏线性方程组是非常重要的一个环节.迭代求解过程......