【摘 要】
:
随着大数据时代的到来,数据隐私保护问题逐渐成为各方关注重心。安全多方计算技术实现了数据的“可用不可见”,为这一问题提供了解决方案,其中秘密共享技术是其当前实用性最强的技术分支,而隐私保护机器学习是其最热点的研究方向。然而,秘密共享技术仍存在计算效率低下、扩展性不强等限制。最新的CryptGPU方案通过将计算迁移到GPU上提升了计算性能,但其主要关注线性计算的效率提升,而忽略了非线性计算的效率问题,
论文部分内容阅读
随着大数据时代的到来,数据隐私保护问题逐渐成为各方关注重心。安全多方计算技术实现了数据的“可用不可见”,为这一问题提供了解决方案,其中秘密共享技术是其当前实用性最强的技术分支,而隐私保护机器学习是其最热点的研究方向。然而,秘密共享技术仍存在计算效率低下、扩展性不强等限制。最新的CryptGPU方案通过将计算迁移到GPU上提升了计算性能,但其主要关注线性计算的效率提升,而忽略了非线性计算的效率问题,而非线性计算也是机器学习中重要的组成部分,因此提升非线性计算效率对秘密共享技术的整体性能提升同样具有重要意义。CryptGPU方案在非线性激活层计算中需要引入布尔电路,随着电路深度提升附加大量通信成本,且需要不同类型秘密共享之间的转换,因此无法有效发挥GPU性能优势。针对上述问题,设计GPU友好的激活层优化方案,实现高效隐私保护机器学习框架,规避布尔电路计算,完全运行在算数秘密共享上,从而有效降低通信成本,提升计算效率。同时激活层模块也是神经网络中所有比较运算所依赖的构建模块,因此优化方案同样有助于其他功能层的计算,从而提升框架整体性能。针对Crypt GPU只能支持有限计算模块,扩展性不强的问题,扩展设计和实现批归一化、随机失活等其未实现的计算模块,从而支持更多样化的机器学习任务,提升框架的扩展性和实用性。在6个标准神经网络和4个标准数据集上进行了实验,实验结果证明优化框架可以支持深层网络和大规模数据集,具有足够的计算精度和更强扩展性。对比当前具有代表性的GPU和CPU秘密共享计算框架Crypt GPU和Falcon,优化框架在隐私推理中取得了最高7.9和11.4倍的加速比,在隐私训练中取得了最高2.2倍和47倍的加速比。
其他文献
零知识证明是一种具有计算完整性和隐私性的加密协议,一方能够在不向另一方提供任何有效信息的情况下,使另一方相信某个主张是正确的。其被广泛应用到涉及隐私的应用领域,如数字货币、可验证机器学习、可验证数据库外包等。零知识证明系统计算瓶颈在证明者模块,缓慢的生成证明速度极大限制系统吞吐率。证明者模块计算流程包括多项式运算和椭圆曲线上多标量乘法两个阶段,这两个阶段会给GPU系统设计带来数据划分困难、数据交换
随着新兴互联网商业模式的蓬勃发展,众包通过利用集体智慧已经成为一种解决大规模、复杂问题的高效、分布式范式,其中人员选择和用户激励是众包系统中最受关注的两个问题。但是,传统的人员决策和激励机制存在以下不足之处:第一,没有充分考虑用户间复杂的关联关系;第二,决策过程只注重短期利益;第三,缺乏对复杂任务的良好建模,因此很难满足日益复杂的众包任务需求。鉴于上述情况,结合强化学习考虑长期回报的特性以及张量强
现如今随着时代发展,我国相关部门对于教育行业的要求愈发严格,其主要是要求各个学校在教书育人的环境中要以学生为主,让他们能够获得更加全面的发展,要帮助学生建立起更加正确的人生观和价值观。针对这个问题,我国的中职院校就希望能够在语文教育中充分融入我国的优秀传统文化。通过这些优秀传统文化的融入让中职院校的学生能够在学习中更加了解我国的民族文化精神,让他们逐渐建立起正确的社会核心价值观以及个人理念,使我们
举人大挑,是清乾隆年间订立的疏通举人仕途的一种制度,分为挑选和授官两个阶段。因关注点不同,学界多聚焦于挑选阶段的研究,而对授官阶段探讨较少。以一等举人为例,分发、试用、甄别、补授四个环节前后相连,环环相扣,构筑了大挑举人的授官机制。环节不同,功用有别。分发是前提,试用是手段,甄别是基础,补授是目的,缺一不可。该机制在实际运作中,增强了科举的向心力和凝聚力,维护了清王朝的政治统治和社会稳定;但因形势
内窥镜视频被广泛运用于医学教育、远程手术、疾病诊断等方面,但一段未经剪辑的内窥镜视频有着大量的模糊片段与冗余片段,严重影响着整段视频的浏览体验,增加了信息获取的时间成本,因此,需要探索内窥镜视频的解析方法。关键帧是一组清晰的、包含了足够信息量的视频图像集,能概括一段视频所表达的主要内容。为了提取出清晰的关键帧,提出了先进行模糊帧识别和去除、再进行关键帧提取的方法。模糊帧识别属于图像质量评估计算的流
Qemu是一个用C语言编写的开源虚拟化软件,被广泛用于云计算业务以提供虚拟化支持。然而在生产环境中,除了完全组件故障,Qemu还会遭遇传统方法难以检测的局部组件故障。未被妥善应对的完全组件故障,以及由局部组件故障积累转化而导致的系统故障,共同导致了系统可用性的下降。目前,针对上述组件故障问题的诊断方案较少,且多面向Java应用,难以直接迁移到Qemu之上。面向Qemu设计并实现了一套静态离线代码分
随着位置服务应用的风靡,位置服务运营商在收集大量的用户移动数据用于数据分析的同时,也带给用户隐私泄露的风险。为避免这一风险,数据发布方在发布数据前通常会对用户的原始数据进行隐私保护处理。但是扰动后的数据在一定范围内仍然保留了用户的轨迹分布特征和轨迹间相似度,隐私泄露的问题依然存在。发现隐私保护方法中存在的隐私泄露场景,对未来的保护方法的完善具有现实意义。现有的移动数据推理研究中,针对差分隐私保护的
电弧增材制造技术因沉积率高、短周期、高利用率和低成本等优点,具有广泛的应用前景。但在其生产过程中,存在很多干扰因素使零件表面产生缺陷,影响零件的成形精度。在电弧增材制造过程中,检测零件表面缺陷并对缺陷区域进行修补可以提升零件的最终成形质量。基于电弧增材制造点云数据的表面缺陷检测系统可以应用于电弧增材制造的在线监测领域,提高电弧增材制造生产过程的自动化程度和成形零件的精度。首先,将系统的功能模块划分
物理不可克隆函数(Physical Unclonable Function,PUF)是在资源受限设备上实现硬件安全的一种重要解决方案,具有轻量级和唯一性的优势,其结构主要为数字电路PUF。目前攻击PUF的机器学习方法主要包括逻辑回归、可能近似正确、布尔函数等,这些方法大多存在着准确率较低、数据量大的问题。高效机器学习算法的研究主要是提出新的建模攻击方法或者改进当前已有的算法,从以下两方面展开。首先
在脑部CT血管造影成像(Computed Tomography Angiography,CTA)图像中对脑颈动脉供血区域进行分区,对于脑梗死和脑肿瘤等疾病的诊断和治疗非常重要。目前广泛使用人工对脑颈动脉供血区域进行分区的方法,存在对医生专业水平要求高且质量难以控制和效率低的问题。针对人工分区方法的缺点,提出一种全自动的基于CTA图像的脑颈动脉供血分区方法,先使用深度学习网络自动标记出脑颈动脉的不同