基于龙芯3B的循环规约算法向量化研究

来源 :计算机工程 | 被引量 : 0次 | 上传用户:nimashabi2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究国产CPU龙芯3B的体系结构,分析三对角线性方程组求解中的循环规约算法,并结合算法特性,提出循环规约算法的优化方案。采用向量化级数,利用龙芯3B处理器提供的向量扩展指令对该算法在龙芯3B上进行实现和优化。实验结果表明,与非向量化算法相比,向量化算法的性能提升较大。
其他文献
2011年湖北省高考理科第13题是:《九章算术》“竹九节”问题:现有一根9节的竹子,自下而下各节的容积成等差数列,上面4节的容积共3升,下面3节的容积共4升,则第5节的容积为__升.
目的探讨风险护理对手术室不安全因素防范效果的影响。方法选取2016年2月至5月手术室收治的240例患者为观察组,采用风险护理;选取2015年2月至5月手术室收治的185例患者为对照
在分析水电开发对生态环境影响及原因的基础上,归纳了近年来水电站建设运行中生态保护措施的研究进展,包括过鱼设施的建设、鱼类增殖放流站的构建、大坝下游河道断面生态流量
已有的语音资料真实性检测方法是对内容或背景噪声进行的榆测,导致对语音信号真实性检测效果不佳。为此,根据数字存储的本质特征和随机共振理论,提出一种语音信号真实性检测方法
20世纪80年代以来,经济全球化与金融一体化在全球范围内不断推进,极大增强了世界各国金融市场之间的相互依存性,单个金融市场的波动不但受到其自身前期波动影响,还受到其他金融市
城市空间在与身体的结合中被建构为"场景",身体在"场景"中被观视。这两个过程被统合在镜头之眼与媒介漫游者的城市观看里。对城市空间的场景建构,以及将身体呈现于这些场景,
为进一步提高图像插值质量,丰富非线性图像插值算法研究,提出一种简化的神经网络插值算法。利用前向反馈神经网络(BP-NN)构造最佳的图像插值模型,通过2组实验确定该模型的BP网络最佳拓扑结构、最佳采样模型和采样点数量,并定量描述每组模型的耗时。实验结果表明,对512×512像素图像采用BP-NN训练点数量为50 000、拓扑结构为8-16-1的参数插值时,该算法平均插值时间约为0.7 s,且其峰值信
为准确学习飞行员操作手势的轨迹分布模式,提出一种改进的层次自组织映射方法。引入Wilcoxon秩和检验技术,结合编辑距离判断内部网的匹配程度,通过交叉验证使验证集获得误差
在美国及其他一些国家,板柱结构是最常被采用的结构形式之一。它的使用灵活,建筑净空较高,易于施工。但它的抗震性能究竟如何,令人怀疑,而震害又屡有发生,板柱节点的脆性破坏
目的探讨在手术室护理管理中有效实施护理风险管理的应用效果。方法随机选择我院收治的200例手术患者,以入院时间先后顺序分为对照组和观察组各100例。其中,对照组患者实施手