指令级优化相关论文
当有限元法用于分析大型电气设备的电磁场时,需要大量的网格来获得更准确的结果,这会导致大规模的计算。但由于计算机内存和软、硬......
尽管高性能计算机性能提升越来越快,但科学计算应用程序获得同步的性能提升是很困难的.提高科学计算应用程序的执行性能,需要依照......
针对国产Unicore架构平台在二维绘图过程中内存填充操作及多种像素格式alpha混合等耗时操作,利用Unicore架构访问32byte对齐内存数......
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先......