多核龙芯3A上二级BLAS库的优化

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:hisandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的分析。实验表明,这些优化可以将二级BLAS函数单线程的性能提升20%以上,多线程下也可以得到2.5倍左右的加速比,这对今后多核龙芯上的系统软件优化工作有着一定的帮助。
其他文献
目前,光照问题已成为影响人脸识别率的关键因素,对人脸识别中处理光照的常用方法进行了对比实验,实验结果表明,光照锥法及近似光照锥的各种算法对光照的明显变化都具有较强鲁棒性,而其他算法在光照变化明显情况下,识别率都有明显的降低,对处理三维人脸图像光照的光照锥和球谐理论的算法,进行了全面深入研究,分析了它们的原理、优势、劣势和结果,提出了以后的研究工作的方向。
对多种隐马尔可夫模型算法进行了分析对比,在此基础上设计了一种改进的离散隐马尔可夫模型(DHMM)算法,并将此算法成功运用到了DSP嵌入式语音识别系统中.该系统采用上述算法完成了
逻辑模型可视化对于软件开发和技术研究具有重要的意义.提出了一种基于图文法制导ER图自动绘制技术,并对图文法进行扩展命名为ER图文法,它克服了在原有建模工具中绘制ER图图幅数
分析了国内外文献管理系统的现状。基于文献之间的属性特征,设计了文献关系模型,并且根据该模型定量分析文献之间的关联程度。在此基础上,设计并实现一个基于文献关系模型的个性
针对摩托车市场的现状和问题,设计并构建了一套远程摩托车故障诊断系统。阐述了该系统的基本框架和诊断流程,并结合实际开发中所遇到的问题给出技术解决方案,最后,分析摩托车
尽管当前许多数据库都提供对XML格式数据的支持,但是由于接口不同,缺乏通用性。采用java技术,开发了一个与平台无关的通用数据交换系统,通过该系统的基于XML文档的虚拟关系数据库
为了实现车载计算平台与汽车内部电子模块的数据通信,通常需要设计一个CAN总线适配器。提出了一种基于USB的CAN总线适配器的设计与实现方法。在设计中采用了内部集成有USB OT
在程序理解中,函数之间的调用关系是程序理解研究的重要内容。一个函数往往代表了一种具体功能或问题求解的实现,构建出函数调用图有助于对程序的理解。以JAVA语言为研究对象
随着旅游业的不断发展,为使旅游者对旅游目的地可以事先进行网上游览,从而使得旅游区信息能被广泛传播和迅速获取,开发虚拟旅游区漫游系统就显得尤为重要。漫游系统采用3DS M
设计了一种基于3G无线网络和嵌入式的远程视频监控系统。本系统选用S3C6410微处理器作为核心控制器,利用Opencv进行视频采集,使用基于H.264算法的X264开源软件进行软编解码,