论文部分内容阅读
智慧城市通过无所不在的物联网获取并传输信息,将海量实时数据交由云计算进行处理,并将处理结果反馈到控制系统,通过物联网实现智能化和自动化控制,最终让城市达到“智慧”状态。大数据、云计算、物联网等技术的发展,为智慧城市实体间的数据交换、共享、分析和使用提供了有效的技术手段,有助于智慧城市安全、科学、高效地运行。智慧城市利用先进的信息技术和通信技术实现城市智能的高效运行,其运行过程中会产生海量多源异构数据,且数据量巨大,增长速度快。通常,这些数据中包含大量个人或组织的敏感信息,所以在数据采集过程中,面临着严重的隐私泄露风险,采集到的数据可能威胁到国家、社会及个人安全。由于城市数据具有动态性强、增长迅速、实时性强等特点,使得传统的数据采集隐私保护方法不再适用。本文针对城市大数据中面临的数据采集隐私保护问题,在Map Reduce工作模型的基础上提出了三种适用于大规模动态环境下的城市大数据采集隐私保护算法。第一,基于Map Reduce模型的k-匿名算法,首先使用Map Reduce模型对大量数据集进行处理,处理过程中进行等价类的划分,使每个等价类中的元组数至少有k条,并且与其他k-1条记录完全不可区分。第二,基于Map Reduce模型的单敏感(α,k)-匿名算法,由于k-匿名模型没有对敏感属性做任何约束,所以,在Map Reduce模型的基础上,使用单敏感(α,k)-匿名模型,保证发布的数据在满足k-匿名的同时,每一个等价类中与任一敏感属性值相关的数据记录百分比都不高于α。第三,基于Map Reduce模型的多敏感(α,k)-匿名算法,单敏感(α,k)-匿名模型的匿名约束面向一个指定的敏感值,因此该模型并不适用于多个敏感属性的隐私保护研究,为了将匿名约束扩展到敏感属性的所有值,提出了基于Map Reduce工作模型的多敏感(α,k)-匿名算法,使数据集中的每个敏感属性都得到保护。通过实验结果和理论分析表明,这三种算法不仅能有效保护数据隐私还具有信息损失量小和执行时间少的特点。