面向数据挖掘的隐私保护方法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户：yjq123wlz

【摘要】

：

为了防止用户隐私信息的泄露,隐私保护技术在数据传输、身份认证、人工智能等领域获得广泛研究,其中面向数据挖掘的隐私保护技术成为较热门的一类。这类研究通常采用匿名化方

【作者】

：

李昕咛

【出处】

：

江南大学

【发表日期】

：

2004年期

【关键词】

：

隐私保护匿名算法数据发布泛化算法社交网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为了防止用户隐私信息的泄露,隐私保护技术在数据传输、身份认证、人工智能等领域获得广泛研究,其中面向数据挖掘的隐私保护技术成为较热门的一类。这类研究通常采用匿名化方法,以保证数据可用性为目标,降低发布数据集中用户隐私信息泄漏的风险。然而,保护隐私数据和降低匿名信息损失的本质是NP-hard问题,且大多仅考虑传统数据类型而存在较大的应用局限性。本文主要针对不同的数据类型和隐私保护需求,提出适当的匿名算法和匿名模型,致力于在保护隐私信息的同时最大限度提高数据可用性,具体工作主要包含以下内容:(1)针对用户多记录发布数据集匿名过程的信息损失问题,提出一种基于自然等价组(Natural Equivalence Group,NEG)和贪心聚类的数据匿名算法。首先对数据维度变化造成的泛化信息损失进行定量研究,打破以元组为单位的匿名传统,以提高匿名效率。同时以自然等价组为单位提出基于贪心聚类的数据匿名发布算法,将记录间的属性距离与泛化信息损失相关联,使聚类的过程始终以最小化信息损失为目标,以提高匿名后数据集的完整性。此外,在传统数值型准标识符属性的基础上,明确了分类型准标识符属性的泛化策略和信息损失计算方法。实验结果表示,所提算法在降低信息损失和提高运行效率方面均有较好的表现。(2)现有的数据匿名模型和算法大多以抵御准标识符属性上的链式攻击为目标,而忽略了敏感属性也可形成敏感指纹作为攻击对象。首先以k-匿名和l-多样性理论为基础,提出一种能够同时保护用户身份信息和敏感信息的双向匿名模型(Bidirectional Personalized Anonymity Model,BP-匿名模型)。该模型可根据实际需求分别设置准标识符属性和敏感属性的匿名强度,提供相对独立的隐私保护。在此基础上进一步提出了满足BP-模型需求的隐私保护算法,同时为了降低泛化造成的信息损失,算法为不同敏感度的属性值设计梯度泛化策略。实验结果表示,算法在提高隐私保护强度的同时,保证了匿名后的数据集可用性。(3)传统匿名数据发布算法大多针对关系型数据进行设计,将其直接应用于图数据匿名可能无法抵御以子图结构为背景知识的攻击。针对这一问题提出社交网络图数据的匿名发布算法,与关系型数据匿名不同,该算法在进行节点划分时需要综合考虑社交网络数据节点的连接关系和用户的属性信息,将同时具有结构和属性相似性的用户节点进行聚类形成超点,使匿名后的图数据能够同时抵御以子图结构和用户属性链接为背景知识的攻击。考虑到社交网络数据存在较多包含缺失数据的元组,将单位信息熵引入属性距离的度量,减少缺失数据匿名造成的数据污染。实验结果表明算法在聚类质量和匿名后数据集的可用性上与同类算法相比具有明显的优势。

其他文献

基于集合经验模态分解的农业灌溉用水量预测

为提高农业灌溉用水量(非平稳时间序列)的预测精度,利用集合经验模态分解处理江苏省农业灌溉用水量序列(2004—2012年),将其分解成不同尺度上的平稳序列,然后用灰色预测和时

期刊

农业灌溉用水量预测集合经验模态分解ARMA模型灰色预测模型

从合作原则的视角探析美国情景喜剧《生活大爆炸6》的言语幽默

在言语交际的过程中,幽默是一种常见的形式。情景喜剧经常通过违反合作原则来达到喜剧效果。因此本文通过对美国情景喜剧《生活大爆炸》中幽默对话的分析,从违反合作原则的角

期刊

合作原则幽默生活大爆炸6

头针互动MOTOmed智能运动训练对脑卒中偏瘫患者下肢痉挛和运动功能的影响

目的观察头针互动MOTOmed智能运动训练对脑卒中偏瘫患者下肢痉挛和运动功能的影响。方法选择2014年6月至2016年12月安徽中医药大学第一附属医院针灸康复科收治的60例脑卒中偏

期刊

脑卒中痉挛下肢运动功能头针MOTOmed智能运动训练系统

羧基酯化改性花生壳对染料废水的吸附

通过甲醇酯化法制备改性花生壳,用于吸附刚果红、次甲基蓝染料废水。考察了吸附时间、溶液pH值、初始浓度对吸附的影响及改性花生壳的再生。结果表明,在室温、刚果红在pH值4.

期刊

花生壳改性吸附刚果红次甲基蓝

基于PBL的小学Swift编程教学项目设计与实践

人工智能背景下人们所具备的各种能力中,信息素养、编程思维尤为重要,信息技术课程、编程课程则作为培养信息素养及编程思维的载体,需要受到足够的重视。通过对文献的梳理发

学位

项目式学习编程课程Swift语言编程思维

中医中药治疗慢性单纯性鼻炎

<正> 伟大领袖毛主席教导我们说:“中国医药学是一个伟大的宝库,应当努力发掘,加以提高。”周总理曾经说:“要推广中草药,中草药副作用小,针对性大。”根据主席教导与总理指

期刊

中医中药治疗慢性单纯性鼻炎防风丸

金龙蛇口服液合华蟾素注射液、黄芪注射液治疗Ⅳ期胃癌的临床观察

目的　探讨中药联合治疗中晚期胃癌的临床疗效。方法　应用中药金龙蛇口服液合华蟾素注射液、黄芪注射液中药联合治疗方案治疗Ⅳ期胃癌30例并与同期应用化疗的10例对照。结果

期刊

胃肿瘤/中药联合治疗方案金龙蛇口服液华蟾素注射液

三维视频编码优化技术研究

视频作为人类传播信息的重要手段,早已在人们的日常生活、工作、学习、娱乐、交际等方面成为不可或缺的一部分。随着科技的进步,人们对于视频质量的需求也在日益增长,这促使

学位

三维视频编码率失真优化深度图编码码率控制

中药芩矾汤治疗下肢丹毒的临床疗效观察

目的通过中药芩矾汤联合抗生素治疗下肢丹毒,观察其各项实验室指标、全身及局部症状改善情况与恢复正常所需时间,探讨中药芩矾汤联合抗生素治疗下肢丹毒的临床疗效及安全性。

学位

下肢丹毒中药芩矾汤湿敷总有效率

东西方战争电影“救赎者”形象构建比较

由于历史背景、意识形态、民族文化的不同,东西方战争影片在表现＂救赎者＂人物的文化内涵、叙事手法和人物形象等方面存在显著的差异。本文选取近年来成功的东西方战争题材电影,

期刊

战争电影救赎者文化背景差异意识形态启示

面向数据挖掘的隐私保护方法研究

与本文相关的学术论文