论文部分内容阅读
应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算(FDTD)核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同网格数计算时间的测试,运算速度比原C语句的速度提高约2倍。