bank冲突相关论文
GPU的浮点峰值、访存带宽以及性能功耗比都超出同时代的CPU若干倍,成为加速计算密集型应用的引擎。然而,实际GPU程序的性能却远低于G......
嵌入式多核结构的共享资源冲突是硬实时任务最差情况执行时间(worst-caseexecutiontime,WCET)估算的难点,而且通过减少共享资源冲突延......
存储系统与处理器之间的速度差距逐渐变大,为此,cache使用了分级机制,但这也带来了额外的存储延迟(cache代价).提出一种利用循环分割和循......
为了在GPU上实现允许k-差别近似串匹配并行算法,并进一步提高在GPU上的算法性能,在综合考虑GPU的存储层次前提下,采取了多种访存优......