大规模机器学习优化与应用研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:kunan8714
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着机器学习在分类、检测、推荐等多个领域取得显著成就,机器学习方法已经被广泛地应用于实际工业任务中,并取得了非常好的效果,创造了大量社会价值。然而,在真实场景中应用机器学习算法仍面临着非常多的问题。首先,目前的机器学习算法往往受到海量数据的驱动,但是随着整个社会对个人隐私保护意识的加强,对数据的收集、存储以及应用正受到越来越多的限制,这就为机器学习长久的发展与应用增加了阻碍。针对目前机器学习中隐私保护的问题,本文对联邦学习,一种成功缓解对分布式数据进行深度学习的隐私问题的解决方案,进行了研究,并从联邦学习数据分布不均的特性出发,提出了一种基于模型交换的联邦学习框架。该框架通过在不同终端间交换模型进行训练,降低各终端模型之间的差异,从而使得聚合模型能获得更好的效果与更快的收敛速度。理论分析也证明了该框架相比传统联邦学习能够获得更接近中心化训练的结果。但是,由于上述框架引入了模型交换机制,为整个系统的通信带宽带来了更大的负担。为了使该框架在真实场景中能有更好的应用前景,本文对模型压缩问题进行了探究。本文立足于大规模推荐系统场景,讨论了对模型嵌入层进行量化压缩的收益与具体实现方法。但是,对于量化的模型压缩方案,目前往往只能通过调参去选取合适的量化值,将花费大量的时间。为了加速量化模型设计过程,本文基于聚类方法与模型参数的统计特性,提出了参数表示空间大小估计方法,达到快速确定最小量化值的目的。同时,在实际场景中,数据的分布特性往往会随时间发生改变。为了使得模型能够始终保持较高的准确率,就需要模型能够对这种变化有快速的响应。本文基于推荐系统中的量化模型,提出了一种改进的优化算法,通过量化参数的跳变比例来调整模型参数的学习率,使得量化模型对在线学习任务能够表现出更好的适应性。
其他文献
近年来,由于缺乏有效的中小企业信息化公共服务系统,公共服务资源难以有效整合,服务协同机制难以建立,服务信息渠道不畅。由于服务机构的相关信息数据数量大、范围广、种类多、变化快和分散化的特点,造成服务缺乏针对性。基于以上情况,本项目统筹各类服务资源和信息资源,建设统一的中小企业公共服务系统。目的是为中小企业提供各类服务,加强国家政策宣传和落实,优化配置中小企业公共服务资源,促进分工合作,加快工业化和信
手性γ-仲胺醇作为具有生物活性的天然产物和药物的重要结构单元,常出现在鞘脂类、抗生素类、抗病毒糖苷酶抑制剂类、环磷酰胺类抗癌药物、肾上腺素受体激动剂类和5-羟色胺重摄取抑制剂类等重要化合物的分子中。另外,手性γ-仲胺醇也可作为重要的构筑模块用于有机合成之中,比如用于合成手性配体或者双环异硫脲类小分子催化剂。合成手性γ-仲胺醇类化合物的方法众多,不对称催化氢化β-仲氨酮类化合物是合成该类化合物最重要
随着国家海洋战略重要性的不断加强,水下机器人技术的发展成为推进海洋战略的关键因素。仿生机器鱼作为水下机器人的一种,摆脱了传统水下机器人效率低、能耗高、噪声大等缺点,是一种游速快、噪声低、推进效率高、灵活性高、工作时间长、工作范围广且能适应多种工况的新型水下机器人。目前仿生机器鱼的主体大多是刚性的,其机械传动的复杂性随着所需的自由度而增加,机器鱼的鲁棒性也随之降低。本文提出了一种新型的线驱动仿生软体
随着传统产业的智能化升级,越来越多的智能化设备应用到工业领域中,如智能仓储物流系统使用移动机器人配合机械臂实现物料的分拣与配送。在此类非结构化环境下,需要为整个系统增加视觉感知能力来保证工作的安全开展。本文针对存在移动机械臂的双机械臂协作场景,提出了一种基于RGB相机对移动机械臂进行空间位姿估计与短期运动预测的深度学习方法,并结合相应的从机械臂避碰策略,实现了双机械臂安全协作任务。本文方法的具体内
对同一场景内物体间的交互关系建模对于视觉理解和运动行为建模有重要意义。在静态场景内,物体间具体明确的交互关系共同组建场景内抽象复杂的事件;在动态场景内,物体们交互协作,以此来避免碰撞或进行群体活动。本文基于图神经网络的信息传递算法框架建模同一场景内物体间的交互关系,针对静态场景下的视觉关系检测任务和动态场景下的运动轨迹预测任务设计算法,并进一步实验给出了交互关系建模的可视化和有效性分析。针对检测图
合成孔径雷达(Synthetic Aperture Radar,SAR)能够全天时全天候地稳定成像,因此在军事和民用领域起着不可替代的作用。然而,受SAR场景复杂性、目标多样性、SAR图像相干斑噪声以及SAR系统和观测平台等限制,SAR图像目标自动识别仍然是一项世界性难题。近些年来深度学习在光学图像识别领域取得了非凡的成就,相关技术被引入到SAR图像识别,并已经取得显著的成果,但现有的研究大多仅利
近年来随着深度卷积神经网络的不断发展,图像分类、目标检测、语义分割等领域都取得了突破性的进展。而与此同时,卷积神经网络所需的参数量与计算量也日益增大,使网络模型在智能手机或嵌入式平台等资源受限硬件上的部署成为了一项相当有挑战性的工作。因此,需要研究对现有卷积神经网络模型进行压缩的算法,减少模型的内存占用和计算量,从而使网络模型在实际部署硬件上能有更好的性能表现。本文对卷积神经网络的压缩和加速算法展
视频服务近些年来在互联网以及移动互联网的流量占比逐年增加,用户人数也呈现增长趋势。用户对视频服务需求的提升推动了新一代,高质量视频标准以及视频技术的产生与发展。超高清(Ultra High Definition,UHD)视频,特别是其中的高动态范围(High Dynamic Range,HDR)视频,是近些年来视频技术发展的重要方向之一。随着HDR视频显示技术,以及HDR视频传输技术的成熟,HDR
自主避障系统是移动机器人自主性的核心体现之一。提高非结构化环境下自主避障系统的安全性和可靠性是当前自主避障系统的重要研究需求。非结构化的环境中可通行区域的几何结构复杂,种类多样,区域边界不清晰,且环境状况不固定。传统的避障系统主要使用几何结构信息和低层次的视觉信息,缺少对语义信息的考虑,因而在非结构的环境下难以区分不同的可通行区域,诸如草地、自行车道、人行道等;并且,传统的避障系统没有衡量地形、语
下一代无线通信系统将会是超快速,超低延迟以及超可靠的。由于低密度奇偶校验(Low-Density Parity-Check,LDPC)码译码复杂度低,误码平层低,能够高速并行运算,因此在未来通信系统中将拥有巨大发展潜力和广阔前景。在高斯噪声下LDPC码的置信传播(Belief Propagation,BP)译码能达到接近香农极限的性能。和积(Sum-Product,SP)算法和由其简化的最小和(M