深度学习中训练数据集隐私保护技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xuru69
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习模型的准确性极其依赖大量高质量的数据集,而现有的深度学习技术对于训练模型所使用的用户数据隐私保护问题没有特别的重视。在医疗相关领域,在深度学习的帮助之下,医生可以更为方便的对医疗影像和其他相关信息进行诊断。但是在保护个人隐私的前提下,如何获取大量的高质量的训练数据集仍然是一个挑战。本论文针对医疗影像数据集隐私保护问题进行了研究,并提出了基于深度学习的聚合模型。高质量医疗领域数据集获取困难主要有三个方面的原因:首先,医疗领域的数据依赖专业性极强的医生进行处理,但是他们的时间有限,无法标注出足够多的样本供模型使用;其次,医疗信息是需要保密的,医疗机构不能简单的将数据分享给相关同行:最后,深度学习网络对训练数据集具有记忆能力,如果网络受到恶意攻击,则可能导致训练数据集中的用户隐私数据泄露。针对上述问题,本文从深度学习算法出发,对集成学习和知识迁移进行研究,在保护模型中数据的隐私的前提下,提出了改进的PATE模型聚合多个参与者的知识。PATE使用教师-学生模型,首先教师网络使用隐私数据集独立训练,通过投票法将所得知识聚合,其次将教师们的信息添加噪声,最后将被噪声保护的信息传递给学生并对学生进行训练,从而达到保护训练集数据隐私的效果。本文提出教师网络传输卷积结果给学生网络,通过按教师的准确率进行概率选择的方式来获取教师网络的相关特征,对学生网络进行训练。由于聚合了多位教师的数据,所以学生对特征的识别比教师更佳。利用皮肤镜图像数据集HAM10000,设计了深度卷积神经网络,对数据进行分析和处理,得出适用于本数据集的模型结构,然后通过调整参数和模型结构来完成对模型的优化,将结果应用在改进后的教师-学生网络之中。实验结果表明,改进的教师-学生网络,能够在保持隐私的前提下,不降低模型预测结果的准确率。
其他文献
随着油气勘探开发的不断深入,非常规油气藏已经成为较为现实的勘探突破目标,是未来的接替能源。大庆探区非常规油气藏主要包括致密砂岩油、致密砂(砾)岩气、煤层气和泥岩裂缝
电磁铆接是一种高能率的铆接新兴技术,是利用线圈涡流场来实现铆钉的快速成型。由于其成型能量大可以完成高屈服强度的材料铆钉的铆接。电磁铆接由于其设备尺寸较小,可以解决大型压铆接在开敞性限制条件下无法工作的问题。对提高航空铆接质量与效率具有重要的科学意义与应用价值。本文通过分析总结电磁铆接工作原理,并运用电磁学理论知识,推导出了电磁铆接线圈的感应磁场强度矢量表达式。利用有限元仿真建立电磁铆接模型,分析了
本文针对在水下声传播特性分析的实验研究中,多个水声信号采集阵列之间布放距离远而且没有统一的时间基准,会造成采集数据不准确,数据分析没有说服力等问题,针对这一情况设计一套具有GPS时统同步功能的水听器垂直阵列数据采集系统,系统具备采集时间的设定和同步功能,可以比较方便的进行水声传播试验研究工作,具有精度高,成本低的特点。本文对常见的同步授时手段进行分析,再结合系统实际工作环境,最终选取GPS同步授时
随着2016年澜湄合作机制正式启动,澜湄地区各国家间的产业合作往来不断加强。澜湄六国提倡优化合作的同时在互联互通与产能合作等方面取得了一系列成果。制造业作为国民经济的核心产业,其发展状况与发展水平显著地影响着该地区国家的经济发展水平。澜湄国家除中国与泰国外,普遍处于工业化前期,亟需大力发展制造业,加快提高制造业在三次产业结构中的比重。同时,大力推进制造业发展可以优化该区域的资源配置、营造产业发展的
浅覆盖区成矿潜力巨大,且在我国分布较广、面积较大,在资源日益紧缺的今天,加大对浅覆盖区的地质研究显得尤为重要。集宁浅覆盖区位于华北克拉通北缘,处于内蒙缝合带以及华北中央造山带的交界区域,构造活动较为剧烈,多处断裂发育,且研究区内已经发现多处大型矿床。研究区的80%面积以上的地表被第三系、第四系沉积物所覆盖,采用具有“穿透性”的地球物理方法进行研究可以克服覆盖层的遮蔽作用,进行覆盖层下的岩性填图研究
本研究对污染场地土著微生物进行了重金属镉(Cd2+)抗性菌株的筛选与鉴定,并对其对Cd2+的去除率和形态转化进行了研究。同时研究了羊肚菌对重金属镉的去除作用及形态转化的影响,最后将二者复配制成复合菌剂,研究了复合菌剂的发酵条件及协同增效性,取得了以下结果与进展。1.本研究通过对土样进行初筛和复筛,从重金属污染场地筛选出一株Cd2+抗性菌株JX-2019-3。对菌株JX-2019-3的形态及生理生化
茅维是明万历年间的著名文人,著述颇丰,存词100首、杂剧8种。本文将主要研究茅维的词与杂剧,并且立足其词与杂剧的文本,探究其词与剧曲之间的融通。第一章主要梳理茅维的青年、中年与晚年生活,在已有的文献资料基础上,重新整合其科举经历,并且探究他得益于家族传承、文人社集交往的才情和刚直情怀。第二章研究茅维词。根据题材,将其词分为闺情词、述志抒怀词、赠答词和咏物咏景词加以深入分析;结合其和韵《草堂诗馀》词
井下CO浓度超限严重威胁煤矿安全生产。本文以串草圪旦煤矿6103、6104和6106工作面为研究对象,通过系统收集和统计煤矿井下气体采样测试数据,分析了井下气体组分浓度的变化特征及各气体组分浓度之间的相关性,查明了CO异常涌出规律;通过开展低温氧化模拟实验,综合评估了煤低温氧化过程中各气体组分浓度的变化,探讨了氧气浓度、温度、粒度及气压对煤低温氧化过程的影响;提出了煤矿井下CO成因划分方案,分析了
橡皮囊成形是航空企业中钣金件的重要成形方法之一,随着现代飞机对钣金件精密性要求提高以及计算机技术的发展,运用数值模拟技术研究钣金件的橡皮囊成形工艺已成为趋势,但目前通用有限元分析软件的应用存在对技术人员工程背景及软件使用能力要求较高、建模过程繁琐且效率低等问题,基于上述背景,论文做了以下研究:以Java Script和ANSYS Workbench软件开发包SDK为工具,结合橡皮囊成形有限元建模过
混合动力汽车作为传统汽车向纯电动汽车转变过程中的过渡产品,因其具有节能减排的特点,已经成为目前研究的热点。对于混合动力汽车整车控制而言,主要包括两类控制问题,一是稳态的能量管理控制策略对于多动力源进行分配;二是是动态的协调控制策略,包括换挡过程中协调控制、模式切换过程中协调控制。本课题以某车企全新开发混联式10.5 m混合动力城市公交车项目为依托,开展了基于产品开发阶段整车级目标的确定,概念设计阶