blas相关论文
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保......
期刊
针对龙芯3A体系结构,该文通过变量代换或消除、简化依赖关系、增加热点数据副本、并行流水等方法对BLAS函数和LAPACK函数做并行化,......
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性......
双精度普通矩阵乘法DGEMM是BLAS库中最核心的函数之一,大部分三级BLAS库函数的核心计算都是通过调用DGEMM来实现的.该文针对龙芯3A......
Two approaches are widely used to describe particle systems:the continuum approach at macroscopic scale and the discrete......
为提高工作面复杂构造煤层支护安全性和回采率,以同煤某矿某工作面为例在分析其地质、煤层等条件的基础上,针对性的对其掘进巷道和......
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的......
作为当今世界能量供应系统(包括电缆和所有的配套部件)著名制造商,以及高性能工程塑料滑动轴承的研究者、开发商和生产商,易格斯又......
在积石峡水电站导流洞进I:1岩坎爆破中采用分阶段、分区d.x-,并采用中间拉槽的方式创造临空面,改变了抛掷方向,采用垂直孔相结合保证了......
BLAS库是基本线性代数子程序库,是许多大型科学与工程计算的核心计算程序,FitenBLAS库是在多核多线FT1000微处理器上开发的基本线......
青岛地铁一期工程3号线03标段区间隧道下穿济军第一疗养院口腔科医院,隧道埋深14m。为了将爆破震动的影响程度降低到最小,开挖过程中......
对云南省德宏傣族景颇族自治州瑞丽市芒喊砖厂烟囱进行近体防护爆破拆除,爆破拆除时需考虑烟囱周边存在多个需保护的建(构)筑物、......
利用SMP结构的多处理器结点通过高速网络构造高性能并行计算系统是当前的一种发展趋势.为了使BLAS在SMP结点上具有更高的效率,本文......
根据长220m的曹娥江何家老桥的环境和结构特点,桥梁其它关键部位(如主拱肋顶部、桥墩横梁、直接与桥墩连接的桁架节点)与爆破主体桥墩......
介绍了复杂环境下的地下室基坑实行快速控制爆破拆除。采用了合理的爆破参数和起爆网路与机械拆除相配合的方式,对边墙及与保护区的......
因新厂房的基础建设需要对原厂房残留基础进行快速拆除。针对电厂残留钢筋混凝土基础体积大、环境复杂、工期紧等因素,采用大孔径......
为寻求台阶爆破降振效果最佳的孔间延时时间,借助ANSYS/LS-DYNA程序对台阶爆破在不同延时起爆时间条件下产生的爆破振动进行了数值......
介绍了梅山2号高炉为实现尽快达产,在设计、施工及开炉准备方面做的探索。主要包括依据铁水温度迅速降低[Si],依据鼓风动能确定进风......
在炮采工作面中,为提高块煤率,对小直径药卷倾斜孔微差爆破技术参数进行了理论分析和现场小规模爆破试验.实践证明,这种技术可以明......
构皮滩水电站下游碾压混凝土围堰爆破拆除是大体积碾压混凝土可利用性爆破拆除,其下部结构作为永久建筑物,需要拆除上部的碾压混凝土......
在公路路堑切槽开挖硐室控制大爆破中,采用较大不耦合比较进行松动控制爆破.在较为复杂的地质地形条件下,通过合理地选择爆破方案......
硐室加深孔预裂爆破能够显著地降低硐室爆破所带来的地震效应,有效地解决爆破振动所造成的边坡稳定性、边坡质量和爆区附近建(构)筑......
研究目的:尝试在软土地基处理进程中取代强夯产生的动载荷的新方法。研究方法:本文通过宁启铁路线DK 172+000~DK 172+200段软土路......
为了探究采用灌浆套筒连接的装配式框架-剪力墙结构的爆炸响应与破坏模式,运用LS-DYNA软件建立一榀两层的现浇框架-剪力墙和装配式......
根据待拆楼的结构特征及周边环境等因素,确定了待拆楼的爆破倾倒方向及技术参数,通过经验公式进行了爆破有害效应验算,并对爆破振......
通过开展五个专题的研究,基本阐明了呼和浩特抽水蓄能电站建设和运行对内蒙古706电视发射台可能产生的影响,包括上水库施工产生的爆......
以青岛地铁2号线某区间隧道近接建筑物爆破施工为背景,采用大段别雷管孔外延期技术,对上下台阶爆破网路进行优化,实现隧道快速掘进......
为更精确地评价岩体可爆性,结合CRITIC法与Vague集理论,建立了岩体可爆性评价的CRITICVague模型。选取抗压强度、岩石容重、完整性......
Beowulf计划关于“基于COTS技术以满足特殊计算需要”的思想使得机群计算成为高性能计算的一个重要流派.本文针对类Beowulf机群的I......
对爆破前的准备、爆破设计和爆破施工组织等方面做了比较充分的阐述,指出施爆前应细致调查爆破体的结构、性能,精心设计爆破方案,优化......
应用削壁充填法开采阶段内倾转急倾斜极薄矿脉 ,取得了较好的经济效益 ,对其他矿山有参考价值......
蜂窝体在使用过程中常出现堵塞、烧损等现象,影响炉内正常供热,分析认为是由于煤气中粉尘过多和蓄热体结构不合理所致.为此,先后采......
BLAS level-3运算的计算复杂度较高,其往往成为应用的性能瓶颈。采用线性阵列结构的矩阵乘协处理器可实现高性能、高效的矩阵乘运......
针对龙芯3A体系结构,通过底层BLAS库的优化、LAPACK分块算法中分块大小的改善以及LAPACK函数的单独优化这三种途径来提升LAPACK函数......
电子克隆是一类近来发展起来的,通过有限的部分序列信息探针在Genbank数据库中比对,进而获得全长cDNA的真核基因克隆策略,而且该方......
高性能计算广泛运用在科学计算、可视化处理、商业数据模型分析等领域。程序性能与平台架构息息相关。龙芯作为具有自主知识产权的......
基于OpenBLAS和BLIS开源线性代数基础算法库,对稠密矩阵乘法GEMM运算的性能优化展开研究。针对如何选取稠密矩阵分块并行算法的关......
图聚类是指把图中相对连接紧密的顶点及其相关的边分组形成一个子图的过程,在包括机器学习、数据挖掘、模式识别、图像分析及生物......
鉴于图像匹配中单一特征难以获得理想效果的问题,提出一种改进的基于深度卷积网的图像匹配算法.首先对卷积层作展开,利用BLAS(Basic......
BLAS(Basic Linear Algebra Subprograms)是一个以向量和矩阵为操作对象的基础函数库.该库中函数分为3个级别,各个级别分别提供了向......