差分隐私用户轨迹数据发布研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:wendi8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于位置的服务利用地理信息为人们的日常出行提供导航服务,服务期间用户不断上传的位置信息形成轨迹大数据。用户轨迹数据的发布可为城市规划、商业决策等提供有力支撑。然而,直接发布未经隐私保护的轨迹数据,恶意攻击推理将对用户的安全、财产等产生严重威胁。因此,常利用差分隐私模型进行轨迹数据发布。该模型通过扰动数据来保护用户隐私。如何在保护隐私的同时兼顾高数据可用性,是轨迹数据安全发布研究中的重要内容。目前差分隐私轨迹数据发布主要有两个方向。一是通过扰动用户轨迹数据集中的位置点来保护用户隐私;二是通过扰动由用户轨迹数据集所得到的轨迹流量图来保护用户隐私。本文对以上两种发布方向展开研究,结合现有研究成果,提出在保证隐私安全的前提下具有更高数据可用性的轨迹数据发布方法,并进行实验验证。本文主要工作包括:(1)现有的通过扰动轨迹数据集中的位置点来保护用户隐私方法中多采用直角坐标系表示位置信息。本文发现,差分隐私下利用极坐标系表示位置信息可以降低全局敏感度。由此,本文提出一种基于极坐标的差分隐私轨迹数据保护算法,该算法首先寻找轨迹中的频繁停留点,并通过检测位置点的类型来确定涉及用户隐私的关键位置点;然后,将关键位置点的直角坐标系表示转换为极坐标系表示,并对其添加噪声实现差分隐私轨迹数据发布。实验表明,本文所提出的算法在真实数据集上有效提高了数据的可用性,尤其在隐私预算越小时提高越多。(2)在利用用户车辆轨迹数据集实现轨迹流量图发布场景中,所发布数据应当具有非负性。已有研究表明,在差分隐私轨迹流量图发布过程中有效利用数据的特征,可极大提升数据发布效果。现有方法通过实现轨迹流量图中出入度的一致性特征来提高数据可用性,并未考虑数据的非负性。为此,本文基于现有的差分隐私轨迹流量一致性的发布方法,结合数据非负性,提出基于流量非负性的差分隐私轨迹流量发布优化方法。实验表明,本文所提出的方法能减少平均26%的误差。(3)由(2)的工作进一步考虑,轨迹流量图的流量数据都是整数,且现有的车流量调查报告指出大多数路段的车流量来往相近。为此,本文基于此现象提出基于数据特征的差分隐私轨迹流量发布方法,该方法通过构造对称矩阵,使得发布数据能同时满足一致性、非负性和整数性的数学特征。实验表明,本文所提出的方法在同一路段的车辆来往相近情况下,可以大幅度提升数据的精确性。
其他文献
时间序列广泛存在于工程技术、金融分析、自然科学研究等诸多领域中。自上个世纪初以来,时间序列模型的研究就备受研究者的关注,其中包括早期的线性自回归模型、滑动平均自回归模型以及后来为适应不同研究领域的应用而提出的各种非线性时间序列模型。基于状态相依的自回归径向基函数(RBF-AR)模型就是其中一种广泛用于时间序列建模的非线性时间序列模型。关于RBF-AR模型的参数辨识、模型选择、遍历性等问题的研究一直
学位
分段线性微分系统是一类特殊的微分方程,具有比光滑微分系统更丰富的动力学性质.并在工程和应用科学中有广泛的应用,具有特殊的研究意义,是近年来研究的热点.本文在某参数空间下,完整研究了由两条平行线分隔形成三个线性区域的非对称的四参数连续分段线性微分系统的全局动力学.具体研究内容如下.首先,完整研究了系统的有限远平衡点和无穷远平衡点的定性性质,包括了平衡点的数目、类型以及稳定性.本文利用雅可比矩阵的迹和
学位
布线是超大规模集成电路(Very Large Scale Integration,VLSI)物理设计中至关重要的一步。由于布线问题复杂度高,故将其分为:总体布线,轨道分配和详细布线三个阶段。其中,Steiner树由于具有比其他方法求得的连接树总长更小的优点,成为了解决总体布线中多端线网的最佳模型。传统的总体布线以曼哈顿结构为互连线模型,其布线方向受限,且传统的精确算法和启发式算法难以满足复杂性呈指
学位
薄板在工业领域应用广泛,相比于传统加工,采用激光切割的方法加工薄板具有装夹简单、效率高、精度高等优点,因此激光切割技术被普遍应用于薄板加工。激光切割过程是个复杂的热力耦合过程,传统建模方法难以对激光切割质量进行准确地建模。目前,数据挖掘技术已成为激光切割质量建模的新趋势,但基于数据挖掘的薄板激光切割质量研究还有待深入。为此,本文基于数据挖掘技术对薄板激光切割质量开展了如下研究:(1)为了采集足够的
学位
云存储提供了灵活便捷的数据存储服务,数据拥有者将数据上传到云中存储,以减少数据存储和维护开销。为了保护数据隐私,数据拥有者会将敏感数据加密后外包到云平台存储。但原始数据与密文数据之间就失去了关联性,数据用户将无法使用明文搜索技术对密文进行搜索。可搜索加密是一种直接支持用户在密文数据上进行搜索的技术。为了满足云存储环境中不同用户的密文搜索需求,本文针对现有可搜索加密方案的不足,提出了新的可搜索加密方
学位
镁合金作为一种轻质金属结构材料具有较多的优点,例如高比强度/比刚度、密度小和易回收等,在3C电子、航空航天、汽车和生物医疗等邻域具有广阔的应用前景。然而,镁合金在室温下的塑性变形性能较差,通常需在温热状态下成形,因此研究者在金属板材渐进成形的基础上开发出了各种温/热渐进成形工艺,但不同的加热方式对材料成形性能及零件质量有一定的影响,而目前有关这方面的研究较少。本文以AZ31B镁合金轧制板材作为研究
学位
可分离非线性模型,通常可表示成一系列非线性函数的线性组合形式,这类模型广泛应用于机器学习、系统识别、信号处理、时间序列分析等诸多领域。针对这一特殊结构的非线性模型的参数估计问题,产生了大量以批量数据处理为特点的离线学习算法,如交替的最小二乘(ALS)算法、联合优化(Joint)算法、变量投影(VP)算法等。然而,随着信息技术的快速发展和互联网应用的日益普及,数据的产生速度越来越快及对在线实时估计的
学位
本文以工程机械中润滑油和燃油中易混入水而导致润滑系统和发动机系统失效为背景,基于超润湿材料设计方法,针对工业生产中存在的分层油水和分散油水(乳液),利用金属橡胶设计并制备了两种高效分离油水的超润湿材料,解决传统超润湿材料表面微观形貌易磨损的难题。本文主要进行了以下几点研究:(1)深入研究金属橡胶的制备工艺,推导出金属橡胶孔隙度计算公式,基于平均水力直径模型推导出金属橡胶水力直径。在此基础上,针对工
学位
通常高维数据中蕴含着大量的隐私信息,如果直接发布可能导致隐私的泄露。虽然差分隐私技术能够严格地保护数据的安全,但随着数据属性维度的增加,其产生的时间成本和噪声干扰也将随之增大。尤其是对于高维二值数据很容易被过大的噪声所覆盖。在现有的高维数据差分隐私发布方法中,很少有针对高维二值数据的发布方法,以致于大多都无法很好地解决该类型的隐私发布问题。因此本文结合现有的方法,针对高维二值数据的隐私发布问题展开
学位
受光照条件或相机参数的影响,数码相机通常无法捕获真实场景的完整动态范围,单次曝光拍摄的图像所包含的动态范围与人眼所能感受的动态范围存在巨大差距。对于光照不足的场景或区域,如夜景、昏暗的室内和背光拍摄场景,相机常由于曝光不足而捕获到低光照图像。低光照图像往往色彩暗淡、对比度低且图像细节丢失。对于光照不足的场景或区域,同时捕获低光照图像和正常光照图像是困难甚至不可行的,且低光照图像难以定义与其唯一对应
学位