向量数学库的向量化方法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:cheng1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
SIMD技术的出现使得基础数学库扩展到向量数学库成为必然趋势。基础数学库中多数函数存在代码实现复杂、分支判断多的特点,增加了向量化的难度,同时SIMD指令的不完备导致函数中的部分功能无法直接向量化,频繁的拆分和拼接操作降低了函数的性能。针对这些问题,提出了向量数学库的向量化方法,通过确定核心代码段、数据预处理过程向量化及指令向量化3个步骤,可以快速有效地对基础数学库进行向量化。实验表明,运用该方法,exp,pow,log10等典型函数的性能平均提高了24.2%。
其他文献
近年来,很多研究者致力于开发自动的性能诊断工具来应对大规模高负荷的分布式环境。云操作系统是云用户与云资源的中间层,诊断并解决云操作系统响应过慢的问题有助于优化云计
针对采集多路雷达视频回波信号的高采样率、通道间超低时间差的要求,设计了一种基于FPGA的6通道实时数据采集系统;该系统单通道采样率为20MSPS,采样精度为12bit,信噪比sNR≈70.2db
运动目标检测是机器视觉领域中的关键技术之一,其在视频运动目标检测、遥感信息处理和军事侦察等领域有广泛的应用。考虑到视频中相邻视频帧背景相似性高且时间连续性长,而阴影和噪声具有非连续性的特征,文中提出一种时间连续性约束的低秩分解背景更新模型,并将其应用于背景模型减除的视频运动目标检测。该方法首先对视频进行低秩分解,获得低秩分量和稀疏分量;然后基于连续性约束背景更新模型更新低秩分量,构建背景;最后通过
以互联网广告为代表的数字媒体广告在飞速发展的同时也显示出许多亟需解决的问题,例如,数字广告的过程不透明,反馈数据造假、多级代理导致的效率低下等问题被放大,广告主的海
异构网络和系统环境下数据的共享和交换是维修保障信息系统的一个关键问题,传统的数据库技术已不适应新的要求;提出了利用XML本源数据库存储维修保障信息,利用XML技术实现松散耦
目前,基于社会网络的团队形成问题研究大多采取0-1规则度量专家技能。针对人们通常使用自然语言描述专家技能的情况,提出模糊多目标进化的社会团队形成方法。该方法研究模糊
双目立体视觉和自组织可增长特征映射图GSOM(Growing Self-organizing Map)相结合的机器人地图构建方法首先利用双目立体摄像机采集图像,借助双目立体视觉处理技术,将采集到的图像信息转化成神经网络的训练样本;然后利用GSOM的地图绘制算法,通过不断增加新的神经元实现网络规模的增长,用441个SOM神经元便表示了2000个样本点的环境特征信息的拓扑地图,体现了对输入样本分布的逼
为建立分离平台式自动化存储系统的双命令行程时间分析模型,寻求自动化存储系统的最佳设计,文中引入新型的系统出入口位置结构,通过分析分离平台式自动化存储系统的运作流程,建立双命令周期的行程时间数学模型,并验证模型优化的有效性。从期望行程时间角度分析,当形状因子b=1时,提出的模型有效率更高,提高了27.92%。研究的创新性在于引入新型出入口位置结构之后,用更为实际的双命令存储模式对自动化存储系统进行了
介绍了基带信号发生的基本原理,采用软件无线电思想,通过软件更新的方式实现了基于FPGA的多制式基带信号发生器;重点研究了基于FPGA的伪随机序列发生、调制映射、高速数字成形滤
针对装备虚拟操作训练系统中对过程建模的研究仅停留在针对具体仿真任务的应用技术层面,缺乏深人的建模理论研究的现象;首先分析了虚拟操作训练仿真目的和装备操作的特点,叙述了