【摘 要】
:
深度神经网络(deep neural network,简称DNN)量化是一种高效的模型压缩方法,使用少量位宽表示模型计算过程中的参数和中间结果数据.数据位宽会直接影响内存占用、计算效率和能耗.以往的模型量化研究缺乏有效的定量分析,这导致量化损失难以预测.提出了一种超低损失的DNN量化方法(ultra-low loss quantization,简称μL2Q),以揭示量化位宽与量化损失之间的内在联系,指导量化位宽选择并降低量化损失.首先,将原始数据映射为标准正态分布的数据;然后,在等宽的量化区间中搜索最优量
【机 构】
:
南开大学计算机学院,天津市网络和数据安全技术重点实验室(南开大学),工业机器人应用福建省高校工程研究中心(闽江学院),计算机体系结构国家重点实验室(中国科学院计算技术研究所)
【基金项目】
:
国家重点研发计划(2018YFB2100300),国家自然科学基金(62002175,61872200),天津自然科学基金(19JCZDJC31600,19JCQNJC00600),计算机体系结构国家重点实验室(中国科学院计算技术研究所)开放课题(CARCHB202016,CARCH201905),中国高校产学研创新基金(2020HYA01003),工业机器人应用福建省高校工程研究中心(闽江学院)
论文部分内容阅读
深度神经网络(deep neural network,简称DNN)量化是一种高效的模型压缩方法,使用少量位宽表示模型计算过程中的参数和中间结果数据.数据位宽会直接影响内存占用、计算效率和能耗.以往的模型量化研究缺乏有效的定量分析,这导致量化损失难以预测.提出了一种超低损失的DNN量化方法(ultra-low loss quantization,简称μL2Q),以揭示量化位宽与量化损失之间的内在联系,指导量化位宽选择并降低量化损失.首先,将原始数据映射为标准正态分布的数据;然后,在等宽的量化区间中搜索最优量
其他文献
当今世界的主流超级计算机越来越多地使用带有加速器的异构系统.随着加速器的浮点性能不断提高,超级计算机内计算节点的CPU、内存、总线、网络以及系统架构都要与之相适应.HPL(high performance Linpack)是高性能计算机评测的传统基准测试程序,复杂异构系统给HPL评测带来很多机遇与挑战.针对带有GPU的异构超级计算机系统,提出一套新的CPU与加速器计算任务分配方式,提出平衡点理论指导HPL性能优化.为了优化HPL程序,提出了使用CPU与加速器协同工作的look-ahead算法和行交换连续流
研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题,对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.首先,简要介绍高性能计算应用软件的现状、趋势和面临挑战,并对几类典型高性能计算应用软件开展并行计算算法特征分析,涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计算化学和格点量子色力学等多个问题、尺度和领域.其次,讨论了面向国产异构计算系统的对策,提炼出若干典型应用算法和软件的共性问题,涉及核心算法、算法发展、优化策略等.最后,面向异构计算体系结构,
目的:探究综合康复治疗对脑瘫患儿近期粗大运动功能的影响。方法:2018年5月-2020年6月收治脑瘫患儿30例,随机分为两组,各15例。观察组给予综合康复治疗;对照组给予单纯运动治疗。比较两组治疗效果及近期粗大运动功能情况。结果:观察组治疗总有效率高于对照组,差异有统计学意义(P<0.05);观察组治疗后粗大运动功能评估量表(GMFM)评分明显高于对照组,差异有统计学意义(P<0.05)。结论:对脑瘫患儿实施综合康复治疗,能够有效提高治疗效果,改善患儿的运动能力,临床价值较显著。
目的:研究功能训练对间歇性外斜视调整缝线术后双眼视功能及复发的影响。方法:2019年12月-2020年12月收治间歇性外斜视患者64例,随机分为两组,各32例。对照组术后不采取干预措施;研究组术后采取功能训练。比较两组术后双眼视功能、眼位及复发情况。结果:研究组术后1周、1个月、3个月及6个月的双眼视功能均明显优于对照组,差异有统计学意义(P<0.05);研究组术后1个月、3个月及6个月的眼位均明显优于对照组,差异有统计学意义(P<0.05);研究组6个月复发率明显低于对照组,差异有统计学意义
HPL(high performance Linpack)是一套被广泛用于测评计算机性能的测试程序,几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作,以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台,尝试为HPL的优化工作提供一种解决方案:Hetero-HPL.在Hetero-HPL中,进程与协处理器的对应关系可被改变,因此HPL算法在单节点独立运行情况下可以完全避免进程间数据传输开销.算法各个重要步骤有能力完全利用物理节点的所有资源,如内存容量、CPU核心、协处理器、P
目的:探讨支持性心理干预在护生带教中的应用效果。方法:选取2019年6月-2020年2月带教的护生200名,作为试验组;选取2018年6月-2019年5月带教的护生200名,作为对照组。对照组采用常规带教方式;试验组在常规带教基础上给予支持性心理干预。比较两组应用效果。结果:试验组理论知识评分、专业思想评分、实践操作技能评分、患者满意程度和带教人员认同度均明显高于对照组,差异有统计学意义(P<0.05);试验组实习后的敌对、抑郁、焦虑、人际关系、强迫及躯体化评分均低于对照组,差异有统计学意义(P&l
目的:探究体验式教学用于护理学教学中对教学质量的影响。方法:选取医学院护理专业学生72名,随机分为两组,各36名。对照组采取传统常规教学方法;研究组学生采取体验式教学。比较两组教学质量。结果:研究组学生综合能力评分、理论知识分数和教学满意度均高于对照组,差异有统计学意义(P<0.05)。结论:与传统教学方法比较,体验式教学在护理教学中能有效提升学生的综合能力,效果显著。
目的:探讨多学科协作(MDT)联合延续护理对糖尿病视网膜病变(DR)患者术后遵医行为及生活质量影响。方法:2018年2月-2020年2月收治DR患者80例,随机分为两组,各40例;所有患者均接受单眼玻璃体切除联合眼内硅油填充手术治疗。对照组接受常规出院护理指导,观察组给予MDT理论为指导的延续性护理,比较两组患者遵医行为及生活质量。结果:观察组患者遵医用药、饮食调整、运动康复、自我检测及定期复诊的比例高于对照组,差异有统计学意义(P<0.05);观察组干预后生活质量各项评分均优于对照组,差异有统计学
目的:探讨围手术期护理对急性主动脉夹层患者术后恢复及生存质量的影响。方法:2019年10月-2020年10月收治急性主动脉夹层患者98例,随机分为两组,各49例。对照组实施常规护理;观察组实施围手术期优质护理。比较两组干预效果。结果:观察组卧床时间及住院时间均低于对照组,差异有统计学意义(P<0.05);观察组干预后汉密尔顿抑郁量表(HAMD)评分、汉密尔顿焦虑量表(HAMA)评分及疼痛评分均低于对照组,差异有统计学意义(P<0.05);观察组生存质量各项评分均显著高于对照组,差异有统计学意义
目前,世界范围的科技革命和产业变革正在孕育兴起,一些重要科学问题和关键核心技术正在呈现革命性的突破先兆.同时,“万物智联”时代正在加速到来,IOT/CPS、AIOT等蓬勃发展,以泛在感知、泛在互联、泛在智能为特征的各类智慧系统,以嵌入式系统为基础,与大数据、区块链、云计算呈现融合发展趋势.