搜索筛选:
搜索耗时1.3883秒,为你在为你在102,285,761篇论文里面共找到 21 篇相符的论文内容
类      型:
[学位论文] 作者:唐士斌, 来源:中国科学院大学 年份:2014
在目前的技术条件下,为了追求更高的性能功耗比与性能面积比,商业处理器普遍采用开发线程级并行的多核结构。多线程编程模型是充分发挥多核处理器硬件执行效率和提高性能的关键......
[期刊论文] 作者:王恩东,倪璠,陈继承,王洪伟,唐士斌,, 来源:软件学报 年份:2016
面向通用计算机系统的指令预取技术无法满足实时系统的应用需求,其中一个重要原因是:无效预取引起的指令Cache内容污染使得实时任务WCET评估值不够精确,导致系统可调度性下降,...
[期刊论文] 作者:范灵俊,唐士斌,张轮凯,郑亚松,张浩,, 来源:小型微型计算机系统 年份:2012
功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来降低C...
[期刊论文] 作者:唐士斌,宋风龙,王达,李文明,刘志勇,, 来源:小型微型计算机系统 年份:2012
程序调试工作的首要基础是错误可重现,然而并行程序执行过程存在天然的不确定性,尤其在多核处理器上,如何重现并行程序的错误是一个巨大的挑战.现有的方法或记录整个系统的状...
[期刊论文] 作者:焦帅, 徐卫志, 唐士斌, 范东睿, 孙凝晖,, 来源:计算机学报 年份:2011
该文提出了一个面向众核处理器的并行模拟器:PartitionSim.PartitionSim采用了一种新颖的方法——时序分割来加速众核结构模拟.时序分割的提出基于这样的观察:在众核结构中,...
[期刊论文] 作者:唐士斌,宋风龙,张帅,范东睿,刘志勇, 来源:计算机学报 年份:2014
并发执行的并行多线程程序执行过程中,不同的访存顺序会得到不同的执行结果.由于再次执行时,难以重现首次执行时的错误,导致并行程序的调试非常困难.确定性重放是解决该问题...
[会议论文] 作者:范灵俊,徐远超,唐士斌,郑亚松,范东睿, 来源:2013全国高性能计算学术年会 年份:2013
近年来,功耗是处理器设计领域的关键问题之一.本文提出了一种针对多线程共享缓存通过过滤不必要缓存路(Way)访问来降低CPU动态功耗的缓存结构,称为Thread id Cache.通过设置和预先访问Thread id过滤器来排除每次访问发生时不同线程对组相联缓存同一组(Set)中其......
[期刊论文] 作者:熊海泉, 刘志勇, 徐卫志, 唐士斌, 范东睿,, 来源:计算机研究与发展 年份:2014
针对虚拟化环境下Guest OS某些特定指令行为不会产生陷入从而在虚拟机管理器(virtual machine monitor,VMM)中无法对其进行监控处理的问题,提出通过改变非陷入指令正常运行条件...
[会议论文] 作者:雷峥蒙,宋风龙,张轮凯,唐士斌,范东睿, 来源:2010年中国计算机大会 年份:2010
由于硅技术在处理器工业发展对处理器工业的影响,为了满足当前对高性能和高吞吐率的需求,众核处理器成为主流计算机体系结构,然而,因为速度限制和精确度的不足,使用传统的方法对众核处理器进行模拟和仿真远远不能满足需求.使用FPGA原型验证能显著提高模拟的速度,但是......
[期刊论文] 作者:王恩东,陈继承,王洪伟,倪璠,唐士斌,史宏志,, 来源:小型微型计算机系统 年份:2016
体系结构模拟技术在计算机体系结构研究和系统设计中发挥着重要作用.通过对计算机系统的建模、仿真及评估,科研人员可以验证新型体系结构设计;将该技术导入产品设计则可以优...
[期刊论文] 作者:王恩东,唐士斌,陈继承,王洪伟,倪璠,赵雅倩,, 来源:计算机研究与发展 年份:2015
随着物联网、云计算与网络舆情分析等应用的快速发展,大数据处理的应用已经成为数据中心的核心负载.数据中心服务器普遍采用多核处理器,而目录缓存作为多核处理器结构中维护...
[期刊论文] 作者:尹首一, 欧阳鹏, 唐士斌, 涂锋斌, 李秀冬, 郑时轩,, 来源:人工智能 年份:2004
深度神经网络已被广泛应用于人工智能系统中,神经网络专用计算芯片成为学术界和工业界的关注热点。Thinker是一款基于可重构计算架构的低功耗神经网络计算芯片,其支持卷...
[期刊论文] 作者:陈继承,李一韩,赵雅倩,王恩东,史宏志,唐士斌,, 来源:计算机研究与发展 年份:2017
在CC-NUMA架构系统中,为了减少缓存一致性维护的开销,大规模CC-NUMA系统通常采用多级缓存一致性域设计,降低平均一致性维护操作数量,从而有效缓解系统性能扩展与一致性维护开销的......
[期刊论文] 作者:陈继承,赵雅倩,李一韩,王恩东,史宏志,唐士斌,, 来源:计算机研究与发展 年份:2017
规模高速缓存一致性非均匀存储访问(cachecoherencenon-uniformmemoryaccess,CC-NUMA)系统通常采用两级一致性域方法来降低缓存一致性协议维护开销,提升系统性能.两级一致性域系...
[会议论文] 作者:范灵俊[1]唐士斌[1]张轮凯[1]郑亚松[1]张浩[2], 来源:2012中国计算机大会 年份:2012
  功耗是当今处理器设计领域的重要问题之一.随着多核处理器的普及,片上缓存占有了越来越多的芯片面积和功耗.提出一种带有无效缓存路访问过滤机制的低功耗高速缓存结构来...
[会议论文] 作者:李文明,叶笑春,张洋,宋风龙,王达,唐士斌,范东睿, 来源:第二届CCF大数据学术会议 年份:2014
大规模并行模拟是研究大数据体系结构的重要方法,对大数据应用及众核体系结构的发展有着不可替代的推动作用.然而,目前的模拟技术不能满足大数据体系结构研究的需求,主要体现在模拟速度慢、配置过程复杂、可扩展性差等方面.为了解决此问题,评估面向大数据应用的......
[会议论文] 作者:范灵俊[1]徐远超[2]唐士斌[1]郑亚松[1]范东睿[1], 来源:2013全国高性能计算学术年会 年份:2013
近年来,功耗是处理器设计领域的关键问题之一.本文提出了一种针对多线程共享缓存通过过滤不必要缓存路(Way)访问来降低CPU动态功耗的缓存结构,称为Thread id Cache.通过设置...
[期刊论文] 作者:尹首一,欧阳鹏,唐士斌,涂锋斌,李秀冬,郑时轩,陆天翼,谷江, 来源:人工智能 年份:2018
深度神经网络已被广泛应用于人工智能系统中,神经网络专用计算芯片成为学术界和工业界的关注热点。Thinker是一款基于可重构计算架构的低功耗神经网络计算芯片,其支持卷积网...
[期刊论文] 作者:李文明,叶笑春,张洋,宋风龙,王达,唐士斌,范东睿,谢向辉,, 来源:计算机学报 年份:2015
大规模并行模拟是研究大数据体系结构的重要方法,对大数据应用及众核体系结构的发展有着不可替代的推动作用.然而,目前的模拟技术不能满足大数据体系结构研究的需求,主要体现...
[期刊论文] 作者:尹首一,欧阳鹏,唐士斌,涂锋斌,李秀冬,郑时轩,陆天翼,谷江源,, 来源:人工智能 年份:2018
相关搜索: