论文部分内容阅读
手机位置数据是一种新兴的轨迹数据源,在支持人类移动研究方面具有巨大的潜力。近期研究指出,基于手机用户独特的活动特征,许多用户能够被轻易地重识别。然而,隐私保护处理对原始数据的改变会导致数据可用性的损失。因此,使用详细位置数据进行活动分析的同时避免隐私风险成为一个挑战。本研究旨在揭示中国一个大型城市的手机用户重识别风险,以及将该数据用于人群移动分析时,用户重识别风险和数据可用性之间的量化关系。首先,以深圳市为例,评估全市某一主要运营商手机用户的重识别风险;然后,提出并实现一种空间泛化方法以保护用户隐私;最后,使用人群移动分析为例,评估隐私保护后数据可用性的损失。结果显示,深圳市的重识别风险不同于西方城市,证明了基于手机位置数据的重识别风险具有空间异质性。其次,发现了重识别风险(x)和数据可用性(y)之间的数学关系y=-axb+c(a,b,c>0;0<x<1)。该关系的发现,为数据发布者在权衡隐私风险和数据可用性之间的关系时提供了科学依据。本研究有助于更好地理解大规模轨迹数据中的个体重识别风险,以及隐私风险与数据可用性之间的权衡基准,有助于降低共享轨迹数据时的隐私风险。