面向隐私保护的多方联合学习方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:houjinlei11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,金融服务行业普遍采用机器学习技术建立各种模型来预测从金融交易欺诈到投资和针对性营销活动等情况。使用逻辑回归算法进行监督学习是该建模常用的机器学习技术,在实际学习阶段之前通常需要与其他数据提供商共享和准备大量的数据。由于隐私法律和保密法规的要求,数据必须保存在系统内部,不能直接外包出去,因此需要对隐私数据进行保密计算。常用的保密计算方法是差分隐私、联邦学习、同态加密和多方安全计算。本文的研究内容是面向隐私保护的多方联合学习方法研究。本文的最大贡献是提出了基于同态加密的机器学习方案,结合业界常用的逻辑回归算法设计了一种同态逻辑回归算法,并基于阿里云的PAI(Platform of Artificial Intelligence)平台实现了一个多方并行同态机器学习系统,系统集成了MPI(Message Passing Interface)框架来提供并行计算。分析了同态加密和多方安全计算的应用场景,详细的介绍了同态加密背景知识,并选择了全同态加密的CKKS方案来加密隐私数据。采用最小二乘拟合多项式的方法来近似激活函数,并利用融合编码技术来减少训练过程的乘法深度,减少算法复杂度。从两方数据通信协议推广到多方数据通信协议,并设计了从两方到多方同态机器学习模型。结合微软的SEAL库实现了同态机器学习系统,系统整体采用C++编码实现,运行速度快,而且系统兼容性强,可以扩展成同态加密的机器学习库。最终实现的同态机器学习系统提供了一个拖放式的界面,使用户可以方便地构建加密的训练和预测过程,而无需具备密码学方面的专业知识。他们要做的就是找到其他要与之合作的用户,将他们的数据表拖到一起,将机器学习模块拖到项目中,然后等待结果。本文在公开数据集上的实验结果表明,使用5台机器,可以在129秒内在4096?576的数据集上训练出逻辑回归模型。该系统在实验参数下,提供了128bits的安全性,并且与明文逻辑回归算法的正确性偏差1%左右,这验证了算法的可行性和准确性。
其他文献
本文通对蛛缘蝽科各亚群16个代表属的比较形态学研究,以支序分析方法探讨了属间系统发育关系,其结果证实蛛缘蝽科为一单源群,支持Schaefe(1965)将该科分为蛛缘蝽亚科和微缘蝽
本文记述在大别山区采到的比蜢属一新种三齿比猛 Pielomastax tridentata sp. nov.,新种近似于细尾比蜢 Pielomastax tenuicerca Hsia et Liu,模式标本保存于山东大学生物系
通过九组钢纤维混凝土预应力连续叠加板的系统试验,分析了钢纤维混凝土预应力连续叠合板叠合面的受力性能。在综合分析试验结果的基础上,提出了无筋叠合面钢纤维混凝土预应力连
辽河三江口地区省界堤防包括东辽河兴开河口至福德店河段和西辽河白市村至福德店河段,堤防总长约285km。该堤防始建于伪满时期,新中国成立后陆续进行了整修加固,1998年大洪水以
当今时代是网络时代,网络文化弥漫在人们的日常生活中,对个人的价值观念和行为方式具有广泛的影响。网络文化营造了一个基于现实的虚拟网络世界,拓宽了个人的生活领域,延伸了
本文报导采自黑龙江省优食蚜蝇属Eupeodes的三新种:金优食蚜蝇,新种Eupeodes(E.) aurosus sp.nov.,林优食蚜蝇,新种Eupeodes(E.)silvaticus sp.nov及陈氏优食蚜蝇,新种Eupeod
选择班戈县雪如、查朗拉2个重要的小型矽卡岩型铁铜矿床为研究对象,在系统的野外地质调查、样品采集和室内岩矿鉴定、分析测试工作的的基础上,开展了2个矿床LA-ICP-MS锆石U-P
星系团是宇宙中质量最大的引力束缚天体,是宇宙大尺度结构中密度相对比较高的节点.因此星系团是研究宇宙学的重要示踪天体之一,也提供了星系多样的寄居环境.基于公开的巡天数
在浙江三门发现猫蛛科一新种,暂归人哈猫蛛属,定名为三门哈猫蛛Hamataliwa sanmenensis sp.nov.本新种与三突哈猫蛛H.tricuspidata相近似,但有明显区别。本属为我国新纪录属
新时代高校思想政治教育更加注重语言艺术的价值挖掘和实效生成,更加突出语言艺术在理论和实践教育中的鲜明、独特作用。语言艺术作为高校思想政治教育艺术的有机构成,在高校