论文部分内容阅读
大数据的时代已经来临。人们在享受大数据带来的丰富知识和各种个性化服务的同时,个人的隐私也面临着泄露的风险。如何保护数据的隐私安全已经成为一个研究热点。本文针对包含了用户活动信息的轨迹数据,提出了一个通用的隐私保护解决框架,并根据一些具体的模型设定,提出了一个可行的数据发布算法。具体来说,首先我们提出了一个用于描述用户行为的基于隐马尔科夫模型的用户模型,并假设攻击者了解该用户模型以及具体隐私保护机制。通过将用户隐私泄露的程度对应于攻击者在获得数据前后对用户敏感信息推测的置信程度,以及将发布数据的质量用一个效用函数来衡量,我们将所需要解决的问题定义为如何在满足隐私要求的情况下尽可能使效用函数最大化。在此基础之上我们提出了一个基于概率的数据发布算法,该算法通过对活动轨迹上每条记录的检查,搜索得到一个发布概率向量使得效用函数局部最优,并输出一个满足隐私要求的活动轨迹。最后,我们通过实验验证了该算法的正确性和数据质量。