Android平台的CNN模型能效优化问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:h462r5134dg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络(CNNs)因其高推断精度和强自适应性而被广泛应用于各种领域,例如:计算机视觉、语音识别等。另一方面,移动手机当前已经成为人类日常生活中的随身携带之物,并且每天都产生着大量与人类相关的传感数据。为了让手机更加智能地服务于人类,许多工程项目也尝试着在移动端利用卷积神经网络处理这些传感数据。然而,由于受到当前移动平台的资源限制(内存、计算能力、电池容量等),基于CNN模型的应用在手机移动平台上并不多见。  目前,手机上基于CNN模型的应用绝大部分都是采用“客户端服务器”模式,但是该模式不仅强依赖于网络性能(如网络稳定性等)而且会导致用户隐私泄露。因此,许多研究学者开始探索如何在移动端离线执行卷积神经网络的前向推断过程。针对这一研究课题,本文提出了一系列优化策略并设计与实现了一套可高能效运行在Android平台的卷积神经网络推断时库。然后,本文利用该推断时库开发了一款生活日志型应用,借以探索从系统层进一步提高该类场景应用运行时能效的策略。论文的主要工作包括:  1.利用预训练好的卷积神经网络模型权重在移动端重构网络,并使用OpenCL异构编程框架开发基于手机GPU加速的卷积神经网络推断时库。  2.基于“剪枝。重训”方法对卷积神经网络模型进行压缩,并在CNN推断时库中引入稀疏矩阵向量乘(SpMV)使得运行时库支持经压缩处理的稀疏CNN模型。  3.为了充分利用当前以及未来移动设备SoC所提供的异构计算能力,本文提出了一种使用移动平台异构设备处理器并行执行CNN推断的能效优化策略。该策略可根据目标平台所配备异构处理器间的能效差异自适应地寻找一个可高能效并行执行CNN推断的设备处理器组合。  4.针对基于CNN模型的生活日志型应用,本文详细分析了该类应用的运行时负载特征,并进一步提出了在系统层使用动态电压频率调节技术(DVFS)提高该类应用性能或能效的方法。  本文工作的研究意义主要包括如下三点:  1.设计与实现了一套集成离线模型压缩、异构计算任务分配等功能的移动端CNN推断时库。  2.提出了基于异构设各处理器高能效并行执行CNN推断的策略,该策略可在运行时主动对目标平台上的异构处理器能效进行评估。  3.探索了从系统层使用DVFS技术优化基于CNN模型移动端智能应用能效的策略。
其他文献
铁路扣件检测是维护铁路行车安全的重要任务。在高速铁路快速发展的历史背景下,铁路维护与铁路安全运营变得越来越重要,作为铁路维护的子任务,扣件自动化检测成为越来越重要
科研项目管理是高等院校与科研机构的重要管理工作内容之一。由于科研工作的特质,科研项目的管理具有较大的不确定性和变动性,一般的工作流管理模式还不能完全适应科研项目动
图像分割是图像处理和分析中的重要过程,它的输出结果直接影响着后续的处理效果.基于图论的图像分割算法由于有比较完备的数学理论基础,最近获得了广泛研究.Normalized Cut是
云计算已经成为一种崭新的IT模式,用户能够方便地通过网络按需访问可配置的计算资源。数据中心为信息服务提供运行平台,高效的云计算平台将数据中心底层的硬件资源进行虚拟化,通
随着信息时代的发展,Web应用正朝着多用户多角色协同的方向发展。在协同Web开发以及使用过程中存在异常,异常的出现不仅降低用户满意度,而且增加开发维护人员维护系统的难度
射频识别RFID(Radio Frequency Identification)是一种利用无线射频信号进行通信的非接触自动识别技术,它具有快速高效、可靠和不需要物理接触等优点,目前广泛应用于动物识别
在单核处理器时代,随着大规模集成电路技术和半导体技术的快速发展,处理器的频率和集成度的不断提高,这不但使得单芯片单核处理器的功耗剧增,而且使得其设计更加复杂。近年来
RoboCup,机器人足球世界杯,是一个国际性的综合赛事,其中的2D项目提出了一个复杂的实时多主体环境下的智能体决策问题。当前人工智能正处在由“单主体静态可预测环境中的问题
网络图是指由网页及网页之间的链接关系组成的图,通过研究网页间的链接关系,抽取有用的信息,多用于爬虫算法,搜索和社区发现等方面。但在应用网络图时,最主要的问题是网络图
异常检测是指发现系统或用户偏离常规的行为,在信用卡欺诈、网络入侵、系统故障检测等方面有着广泛的应用。异常检测通常将正常的行为特征存储在数据库中,然后将当前行为特征