多源数据环境下的差分隐私保护技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户：linlijun002

【摘要】

：

【作者】

：

魏建好

【机构】

：

湖南大学

【出处】

：

湖南大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着大数据、物联网和社交网络的快速发展,多种大数据平台如社交App、电子商务系统、医疗信息系统等产生大规模的多源数据。不同于传统的单源数据,多源数据类型多样、内容多元化,包含更丰富、全面的用户信息,在实际生活中普遍存在。尽管多源大数据通过挖掘和分析,得到了广泛应用,但同时也引起人们对多源数据隐私泄露问题的关注。目前,加密数据成为保护数据隐私的主要手段之一,但该方法限制了数据的可用性。差分隐私作为一种可严格数学证明的隐私保护技术,通过降低一定程度的数据可用性,对多源数据进行加噪模糊来保护隐私。平衡多源数据的可用性和隐私保护已成为现实中迫切需要解决的研究课题。本文深入研究了四种典型的多源数据场景（个性化医疗、踪迹社区推荐、空间众包、社交话题推荐）下的差分隐私保护问题,主要包含以下四方面工作和创新点:（1）针对个性化医疗中已有差分隐私方法仅保护多源基因数据发布的基因型或表现型隐私,不支持查询隐私保护和基因匹配等问题进行研究。本文首次提出了一种基于差分隐私的基因匹配方案DPGM（Differential Privacy-based Genetic Matching）,同时保护多源基因数据发布和查询隐私,且取得高数据可用性的基因匹配。首先,为同时保护基因数据发布的基因型和表现型隐私且支持基因匹配,提出了一种基于差分隐私的EIGENSTRAT算法对多源基因序列的EIGENSTRAT统计进行加噪,选择含噪声的显著单核苷酸多态性SNPs数据构造噪声发布序列。其次,由于单个查询序列无法满足差分隐私,采用汉明距离构造查询序列的相似数据集,提出了一种新的基于差分隐私的N阶马尔科夫算法产生含噪声的Markov短序列,确保了数据可用性。为降低存储开销,基于四叉树结构,构造与真实查询具有最大噪声频次的噪声查询序列。最后,为获得有效匹配结果和降低系统开销,提出了一种基于最长公共子序列的基因匹配算法计算发布序列和查询序列的最长公共子序列。安全性理论分析证明了DPGM方案满足ε-差分隐私。该方案的实验评估结果显示基因匹配的数据可用性高达86.629%,可以取得有效的匹配结果。（2）针对踪迹社区推荐中已有差分隐私方法依赖可信第三方保护多源踪迹数据隐私且数据可用性不高的问题进行研究。本文首次提出了一种基于差分隐私的踪迹社区推荐方案DPTCR（Differential Privacy-based Trajectory Community Recommendation）,以实现踪迹隐私本地化保护,同时执行有效的踪迹社区推荐。为本地化保护踪迹隐私而不依赖第三方,提出了一种基于语义期望的位置模糊算法,将踪迹的真实位置模糊为具有最大语义期望的噪声特征位置,取得较高的踪迹语义相似性。同时提出了一种基于地理距离的踪迹构造算法,构造和真实踪迹具有最小地理距离的噪声踪迹,确保了噪声踪迹数据的可用性。为取得高质量的踪迹社区推荐,提出了一种基于语义-地理距离模型的踪迹聚类算法,将与用户踪迹具有高相似性的噪声踪迹聚类到社区中。严格的隐私理论分析论证了该方案取得ε-差分隐私,且实验结果显示DPTCR方案的数据可用性较已有先进算法提高3.05%左右,提升了踪迹社区推荐服务质量。（3）针对空间众包服务中已有差分隐私方法仅保护多源工作者位置隐私而没有保护多源任务位置隐私问题进行研究。本文为同时保护任务和工作者位置隐私且分配有效的任务,提出了一种基于差分隐私的任务分配方案DPTA（Differential Privacybased Task Allocation）。针对多源工作者位置分割粒度不均衡带来的低数据可用性问题,首次提出一种自适应三层网格分解算法将工作者网格自适应分割为三层网格,确保分割的网格粒度既不稀疏也不稠密。为保护任务位置隐私,首次提出一种基于差分隐私的自适应完全金字塔网格算法,将任务位置区域自适应分割为多层噪声网格。为降低工作者移动距离和系统开销,提出了一种优化贪心算法计算任务网格附近的Geocast区域。为取得有效的任务分配,提出了一种基于二项分布的任务接受率模型确保任务的高接受率。安全性分析证明了该方案遵循ε-差分隐私。实验性能结果表明了DPTA方案的数据可用性超过86%,可以分配高质量的任务。（4）针对社交话题推荐中已有差分隐私方法没有本地化保护多源文本社交内容隐私且不支持动态社交内容安全发布等问题进行研究。为本地化保护文本社交内容,并取得高质量热点话题推荐服务,本文提出了一种基于本地差分隐私的热点话题推荐方案。首次考虑社交关键词的相关性隐私,提出了一种基于图的本地差分隐私算法将高相关性的关键词聚类到图类中并添加Laplace噪声。为打破高维本地差分隐私带来的低数据可用性诅咒,首次提出一种压缩感知不可区分性机制将高维社交数据降维,对社交话题添加可控的噪声。为支持动态社交内容安全发布且确保数据可用性,提出一种基于动态图的压缩感知不可区分性算法,采用隐私预算分配概率模型模糊在线社交内容。为确保高质量热点话题推荐,提出一种基于话题分布相似性模型的话题突发性算法,将与用户噪声话题分布相似度高的热点话题推荐给该用户。基于安全性和理论性能分析,该方案可以提供高效的本地差分隐私保护。真实Twitter数据集上的实验结果表明了该方案在提供高隐私保护水平下,热点话题推荐的数据可用性高达88%以上。

其他文献

皮影艺术风格的国风游戏同人头像生成APP设计研究

随着现代技术的飞速发展与多元文化的不断碰撞,各种新兴的娱乐形式层出不穷,而传统手工技艺、表演技艺等在娱乐至上的年代日渐式微,以皮影艺术为代表的大量优秀传统技艺面临着后继无人的窘境。青少年是民族的希望,是中华传统文化传承的纽带,但在当今数字化背景下,古老的文化艺术依靠传统的表现形式与传播形式来吸引现在的年轻人已经比较困难,而与时下年轻人喜爱的流行文化相结合、进行符合当下年轻人喜好的创新式表达则可以更

学位

电梯更换工程投标报价技巧探讨

近年来，使用年限达到15年以上住宅小区的设施逐渐老化，需要维护、更新，作为住宅小区配套设施的电梯，也达到了需要更换的年限。电梯更换工程专业性强、造价高，如何在众多投标报价中脱颖而出，成为中标者需要采取何种报价策略。文章重点以北京市区某住宅小区更换电梯工程为例，电梯更换工程通常包括设备的采购、安装、原有设备的拆除、折旧、土建修复，与新建的电梯工程相比，由于住宅小区内用户流动性、现有成品保护性，电梯设

期刊

基于乘客换乘行为的轨道站公交接驳优化研究——以厦门轨道一号线为例

随着城市轨道交通的建设和发展,公交与轨道换乘也开始成为我国城市居民出行的重要方式。但由于公交网络的建设早于轨道交通,两者的接驳换乘建设并不十分完善,存在着换乘距离远、换乘时间长等轨道站公交接驳服务水平不高的情况。为促进我国城市公交与轨道的良性社会互动,提高居民出行的便利性和舒适性,因此,有必要对轨道站公交接驳优化进行研究。首先,本文厦门轨道一号线为例,应用IC卡刷卡数据进行OD匹配以及换乘识别,收

学位

创新考查形式培养高阶思维——2021年高考物理北京卷第15题的分析与启示

2021年高考物理北京卷第15题是一道实验题，该题一改以往对于某一个实验的若干个环节进行挖空和设问的方式，而是以实验环节要素为线索，结合多个实验的某一环节进行设问和考查。这种考查方式不再将过多的分数分配给一个实验，拓宽了实验题的考查范围。同时，以主观题的形式考查实验操作背后所蕴含的本质原因，突出了对学生高阶思维能力的考查。

期刊

硬质合金及金属陶瓷工具材料的强韧化研究

本文系统研究硬质合金及金属陶瓷烧结致密化过程,分析合金制备过程中的WC粒度控制、碳含量控制和烧结温度控制对合金性能的影响,探索合金的硬质相和粘结相强化对合金强韧化和服役性能的影响。研究结果表明:WC-Co硬质合金材料制备过程中,WC粒度、Co含量和合金配碳对WC-Co硬质合金材料的烧结致密化过程影响显著。细化WC粒度、增加Co含量和提高合金配碳可以有效促进烧结致密化过程。超细晶WC-Co硬质合金的

学位

血液透析患者血清HMGB1水平的变化及其与微炎症状态、内皮损伤的关系研究

目的探讨血液透析患者高迁移率族蛋白B1（HMGB1）水平的变化，分析HMGB1水平与患者的微炎症状态、内皮损伤的关系。方法选取2018年5月～2020年10月在杭州市富阳区第一人民医院肾内科接受维持性血液透析（MHD）的终末期肾病患者84例为观察组，60名健康志愿者为对照组，对比两组受试者的血清高迁移率族蛋白B1（HMGB1）、白细胞介素-6（IL-6）、肿瘤坏死因子-α（TNF-α）、超敏C

期刊

人造荧光石的制备及其特性研究

人造荧光石具有节省能源、装饰美观、警示提醒功能,近年来受到研究学者的关注。但目前的研究集中在人造荧光石的应用,缺乏人造荧光石系统的评价指标和测试方法,人造荧光石色彩单一,影响其光学、力学性能的因素不明确等,制约了人造荧光石的应用和发展。本文从材料角度分析原材料组成设计对人造荧光石性能的影响,提出人造荧光石的制备方法。主要研究结论如下:结合文献调研和室内试验,建立了力学评价指标和检测方法。基于最大密

学位

高效蓝光泵浦Pr3+:YLF激光器及特性研究

Pr3+:YLF晶体是近几年来科研工作者研究的热门晶体。它的发射光谱范围为450-750纳米,几乎覆盖了所有可见光波长。它是获得连续可见光波段激光器以及紫外光波段商用激光器的重要激光介质。在晶体物理学、激光全息显示、数据存储、量子计算、生物医学和红、绿、蓝三原色的激光显示,蓝绿激光水下通信和照明等方面有重要应用。目前对Pr3+:YLF晶体的研究主要集中在波长特性方面,对其热效应和高阶模等方向的研究

学位

认罪认罚案件的量刑建议精准化问题研究

伴随着我国司法体制的进一步深化改革,我国刑事诉讼法在认罪认罚制度内容上做出了许多修订,其中检察机关对于认罪认罚制度中的量刑建议权的行使,引起了理论界及实务界的激烈讨论,对于该项权力提出的内容,已然慢慢演变为由过去的提出幅度量刑转向了提出相对精准的量刑建议,这一转变引发学者的深度思考及实务工作者的高度重视。认罪认罚制度的价值目标之一是提高诉讼效率,精准化量刑建议逐渐成为量刑建议的一种趋势,其恰好是对

学位

“互联网+”时代零售连锁企业人力资源管理的创新研究

随着互联网和零售连锁企业的深度融合,连锁企业获得快速发展,推动了企业人力资源管理的不断创新,同时也对零售连锁企业的人力资源管理提出更高要求。本文在分析零售连锁企业人力资源环境的基础上,针对目前零售连锁企业人力资源管理中存在的问题,提出了在"互联网+"时代下零售连锁企业人力资源管理的创新和突围之路。

期刊

多源数据环境下的差分隐私保护技术研究

与本文相关的学术论文