基于多属性泛化的K-匿名算法的设计与实现

被引量 : 0次 | 上传用户:libin101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗数据之中潜藏着的宝贵的信息资源,合理的开发及利用能够为各行各业的发展起到很好的推动作用。因而,医疗信息的发布得到了各界的广泛关注。然而,医疗信息之中囊括了大量的类似于患者生理和心理状况的隐私信息,一旦泄露,必将会给信息所有者留下难以估量的隐患。因此,医疗信息发布中的隐私保护问题引起了专家学者们的重视。就现阶段来看,常见于信息发布系统之中的三种隐私保护手段即属性删除或移除、数据加密以及数据扰乱或数据随机化并不是十分适用于医疗信息的发布。这主要是因为,医疗信息的发布不仅要保证发布数据的可用,还要保障信息所有者的隐私不被泄露,上述一系列隐私保护手段很难兼顾。因而,本文选用了当下较为流行的K-匿名模型来对医疗信息发布加以实现。然而,就实现K-匿名模型的经典算法而言,其自身还有很多有待改进之处。特别是在泛化属性的选取和一些细节的实现方面,欠缺细致的考虑,这就为其所处理的数据埋下了过度泛化的隐患,进而使得处理后数据的可用性和隐私保护性大幅度下降。为此,本文在实现K-匿名模型的经典算法-Datafly算法的基础上,提出了可以进一步提高处理后数据的精度的基于多属性泛化的K-匿名算法。这一算法在原Datafly算法的基础之上,不仅就泛化属性的选取方式进行了改良而且就泛化属性选取中可能发生的取值最多属性不唯一的情况进行了探讨,大幅度地提高了经K-匿名模型处理后数据的数据精度。本文首先就本文的研究问题和相关的基本理论等进行了简要介绍。接着就实现K-匿名模型的经典算法中的不足进行了列举,并在此基础之上,提出了对上述不足进行了相应的改进了的基于多属性泛化的K-匿名算法。这一新的算法不仅就泛化属性的选取方式进行了改良而且对泛化属性选取中可能发生的取值最多属性不唯一的情况给出了解决方案,极大地提高了处理后数据的数据精度,使得K-匿名模型可以更好地适用于医疗信息的发布环节之中。最后,本文以此算法为基础,设计并实现了基于多属性泛化的K-匿名算法的医疗信息匿名化发布。
其他文献
当前,大学生就业与创业问题成为全社会关注的焦点话题。为了减轻大学生的就业压力,各省出台了相关支持大学生创业的政策与措施,对高校毕业生创业进行补贴,为大学生创业提供优
台湾建筑学家汉宝德之“大乘的建筑观”,沉淀了一个学者深邃的思想。阅读他的建筑观,反思当代建筑界的现状和现代建筑师的职责问题,具有重要的现实意义。该文试从汉宝德生活的时
随着经济与科技的发展,化工仪器仪表与信息控制结合的自动化生产,已经成为化工行业发展的主流,文章重点围绕仪器仪表的分类以及在化工生产的自动控制的实现,展开了论述。
社会经济发展对公路建设需求不断增加,公路施工属于一项较为复杂的系统性工程,其施工工程量较大,工期较长,影响其质量的因素较多,为保证公路工程施工质量,实现公路工程施工经
目前,国内汽车、拖拉机、船用机械等行业中的部分齿轮,已广泛采用精密模锻工艺生产。但由于对齿轮的坯料精度要求较高,一般剪切工艺又达不到生产要求。因此不得不采用落后的
将血管简化为弹性管,并考虑组织对血管壁的约束,利用力学方法建立血液流过血管的力学模型.通过理论分析对脉搏波在血管中的传播规律进行研究。同时分析了血液粘性、血管壁弹性模
呼和浩特的地域建筑文化是以蒙古族为主导,兼收并蓄了汉、回、藏等多种建筑文化,各民族的建筑造型元素在这块土地上碰撞交融,取彼所长,共同构成了呼和浩特城市特有的城市风貌
目的研究分析泰胃美治疗慢性反流性胃窦炎的疗效与临床意义。方法将144例慢性反流性胃窦炎患者,随机分为治疗组(n=72)和对照组(n=72),并采用单盲法进行治疗。治疗组每例口服
胃病时胃黏膜肠上皮化生是胃黏膜多种病理改变的中心点。本文认为:如果肠化、特别是大肠型肠化成为胃黏膜主要而稳定的生物学特征,则需补肾。胃黏膜肠化补肾的原理在于:①虚证的
目的:评价左氧氟沙星与阿奇霉素联用对宫颈炎患者的临床疗效与安全性及其对炎症因子水平的影响。方法:选取2017年2月—2019年2月期间收治的宫颈炎患者92例资料,按治疗方法的