面向隐私保护的多敏感属性数据发布分组方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lgj2097
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来数据发布过程中的隐私保护一直是人们关心的问题,尤其是医疗数据中往往包含患者的许多敏感信息,如疾病类型、就诊医生、过往病史等。目前针对多敏感属性的研究主要是基于L-多样性方法:采用有损连接技术对准标识符表和敏感信息表进行连接,或者对准标识符信息直接进行泛化和隐匿处理,两种处理方法都导致数据损失较大。针对上述问题,论文提出了基于主敏感属性排序分组算法和基于相似准标识符分组算法。基于主敏感属性排序分组算法主要过程:基于敏感属性构建多维桶结构,并将数据记录按照敏感属性取值映射在多维桶结构中,然后基于多维桶进行分组,选取主敏感属性,计算主敏感属性的维容量,按照维容量大小依次遍历各个主敏感属性所对应的每个桶,直到满足多敏感属性L-多样性。基于相似准标识符分组算法主要过程:将数据集执行聚类,在聚类产生的各个数据集中进行分组,每次分组选取一条数据记录,并计算其他数据记录距离其距离,按照距离大小进行排序,尽可能选取距离小的分在一组,并让分组满足多敏感属性L-多样性。仿真实验表明,论文提出的两种分组方法在信息损失度、隐匿率和附加信息损失度三个方面的数据质量度量指标都较低,在保证数据安全的前提下,减少了对准标识符属性的概化和隐匿处理,提高了数据的可用性。
其他文献
1印第安纳波利斯新机场印第安纳波利斯是美国印第安纳州的首府,作为该州最大城市,机场年客流量800万人,货运量在全美国居第8位。2008年底将投入运营的新机场是全美国最现代化
本文对质点在平面内的运动进行教学设计,该设计以实验现象为依据,以力的合成与分解作类比,引导学生一步步得出本节课的主题——运动的合成与分解。
采用准静态压痕(QSD实验方法针对多种材料对集中准静态压痕力的损伤阻抗进行了测试。选取2个特征载荷下的试样进行了超声C扫描探伤和扫描电镜(SEM)显微观察,分析了QSI实验中层合
临床资料:我们选用天麻钩藤饮加味治疗肝阳上亢型眩晕18例,其中男15例,女3例;年龄40~50岁3例,51~60岁6例,61~70岁7例,71~80岁2例。18例患者均有不同程度的高血压,主要症状表现为头晕、头
目的观察双侧肢体功能电刺激对脑卒中早期神经功能恢复的作用。方法将急性脑卒中患者(80例)随机分为两组,发病早期病情平稳后在常规药物治疗基础上开始功能电刺激治疗,对照组
心血管疾病是除肿瘤外导致人类死亡的最主要原因,心力衰竭是各种心血管疾病发展过程的终末结局。在发达国家,心力衰竭的发病率已经占到成年人口的1%~2%,在70岁人群中发病率高
文章主要从可穿戴技术的概述,可穿戴技术在教育教学领域的使用案例分析,可穿戴技术在教学中使用的注意事项等几个角度来论述其对教育的助推作用。它在一定程度上满足了师生与
獐子岛高管们曾于2014年12月初做出的自愿降薪方案,在未达到恢复条件的情形下,公司董事会便通过了终止当年薪酬方案的公告,并从今年开始实行新的薪酬激励方案。獐子岛管理层的出
报纸
<正>静脉留置针现已广泛应用于临床,由于老年人多系统疾病长期、反复住院,现在留置针越来越多地用于老年患者。它不仅减少了患者静脉穿刺次数、减轻了痛苦,有效地保护了静脉,
会议
人体内所含各种组织的横向弛豫时间各不相同,有部分组织T2非常短,即短T2成分,常规MR序列无法采集相应组织的MR信号,即图像上无法显示。超短回波时间MRI作为一种可以显示短T2