基于K-L散度的int8量化方法研究与框架实现

来源 :中国科学院大学(中国科学院人工智能学院) | 被引量 : 1次 | 上传用户:caisilver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们处在互联网的高速发展时期,计算机科学在生活中扮演着越来越重要的角色,人工智能AI(Artificial Intelligence),作为近几年计算机科学中最热门的分支,逐渐走进人们的日常生活,比如智能机器人、语音识别、图像识别、自然语言处理等。卷积神经网络(简称为神经网络)作为深度学习的重要研究手段,具有优秀的特征提取能力和抗噪声能力。同时,由于神经网络的复杂性,导致它对数据量、计算能力以及带宽的要求非常高。为了解决上述存在的问题,研究人员针对神经网络做了很多特殊的优化,优化手段包括压缩、编码和量化。作为常用的优化手段,量化在大多数神经网络中都取得了不错的结果。本论文的主要工作分为以下两个方面:(1)为了解决量化模型的精度损失问题,在传统int8量化方法的基础上,设计了基于K-L(Kullback-Leibler divergence)散度的int8量化方法。与传统的量化模型相比,通过K-L散度量化出来的int8模型具有更高的模型精度,适合应用于“AI医疗”、“AI翻译”、“目标识别”等高精度的场景中;(2)本文在理解神经网络执行框架实现原理的基础上,对框架的功能进行拓展。根据软件设计的思想,在框架中实现了一个量化模块,专门用于量化float32模型。通过该模块,用户可以轻松地将float32模型转换成int8模型。在量化模块的内部,包含了在线量化模块和离线量化模块。对于在线量化模块来说,用户不用对代码进行任何修改就可以直接运行模型,验证int8量化后的结果。对于离线量化模块来说,本文提供了一套完整的离线量化方案,用户可以通过该方案直接生成离线模型。理想情况下,离线模型可以在不依赖任何框架的代码的情况下,独立运行。同时用户可以不用考虑框架和生产环境的差异,直接将离线模型集成到应用中,极大地简化了模型的部署和应用。本文中的int8量化方法和量化模块是一套完整的神经网络量化方案,对于发挥AI处理器低功耗、高并发计算的特点具有实际价值和意义。
其他文献
当下中国网络空间盛行着“讽刺”这种充满激情的话语行为。网民利用网络媒介的扩散性、及时性、互动性、草根性等特征,广泛地对社会现实、政治、群体或个人进行讽刺。“讽刺
光电化学生物检测是近些年来新出现并迅速发展的起来的一种生物分析方法。其检测原理是基于在光照下目标分子与识别元件之间特异性的生物识别作用而导致电信号发生了变化。因
在水处理领域中,超滤膜由于其化学特性和结构的影响,存在通量低、易产生膜污染等问题。在众多制膜材料中,聚偏氟乙烯(PVDF)材料在化学稳定性和耐热性以及机械强度方面表现出
近些年随着各国科技的不断发展,人工智能已成为当今时代发展的潮流,随着各行各业不断的发展,机器人技术已经得到了较大的发挥,同时机器人技术也是衡量一个国家科技发展的重要
空闲时间到世界各地旅游成为时下受人们追捧的一种生活方式。随着人们生活品质和文化鉴赏力不断提升,在旅游景区挑选旅游产品时,满足精神文化需求的景区产品深受人们青睐,并且旅游产品的实用性与时尚性也成为人们选择的一项必要条件。青岛作为山东省一座滨海度假旅游城市,旅游市场潜能巨大,是国务院批复确定的国家沿海重要中心城市。2018年上合峰会和青岛香山旅游峰会的成功举办,来青游客数量迅猛增长。本选题以旅游文创产
钢板剪力墙以其较大初始刚度、大变形能力、稳定的滞回性和良好的塑性在高层建筑中得到大量应用。但钢结构抗火性能差,随着温度的升高钢材力学性能显著改变将影响结构使用的
人脸识别是模式识别和人工智能领域具有挑战性的课题之一,广泛应用于信息安全、金融安全以及公共安全,产生了巨大的经济效益和社会效益。但是,由于原始人脸图像的数据维度较
随着经济技术的快速发展,高层建筑越来越普遍,其数量之大,规模之大,是过去远远不可比拟的。高层的结构形式更加多样化,而在各种灾害面前也面临更高的风险,因此对高层建筑的安
海马体位于大脑丘脑和内侧颞叶之间,主要负责长时记忆的存储。海马体的体积及其功能的异常与很多精神疾病密切相关。因此海马体的准确分割,可以辅助医师对相关精神疾病进行诊
大数据时代,随着互联网技术的飞速发展,互联网上源源不断产生着大量数据,造成数据的爆炸性增长,这其中就包含大量的自然语言文本数据。文本数据是数据价值密度最大、最有利用