基于随机投影数据扰动的隐私保护技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户：play5

【摘要】

：

近年来,信息处理技术和存储技术快速发展,使得相关机构可以收集大量的数据用于数据挖掘。在数据挖掘的过程中,可能需要多方数据所有者发布或共享其拥有的数据,然而,直接发布

【作者】

：

赵家石

【出处】

：

哈尔滨工程大学

【发表日期】

：

2014年期

【关键词】

：

数据发布隐私保护数据扰动随机投影稀疏度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,信息处理技术和存储技术快速发展,使得相关机构可以收集大量的数据用于数据挖掘。在数据挖掘的过程中,可能需要多方数据所有者发布或共享其拥有的数据,然而,直接发布和共享原始数据会导致个人隐私信息的泄露。这种情况下,数据所有者陷入了一个困境:一方面,需要保护个人数据的隐私安全,另一方面,需要针对数据挖掘任务保证数据的可用性。为了解决这一难题,面向数据挖掘的隐私保护数据发布应运而生,并已成为一个非常活跃的研究领域。该领域主要研究如何发布不泄露隐私信息的数据,同时保证发布数据可用于数据挖掘。目前,针对不同的数据类型、不同的应用场景以及不同的攻击模型已经涌现出了大量的研究工作,其中,基于随机投影的数据扰动方法由于其实现简单并有严格的数学理论基础,具有很强的实用性和可靠性,但是,仍然存在一些有待解决的问题。本文主要研究面向数据挖掘的隐私数据发布和共享,针对随机投影数据扰动方法存在的问题以及不同数据发布场景的具体需求从如下几个方面展开研究工作:首先,针对投影矩阵泄露时传统随机投影数据扰动方法的隐私保护性能问题,提出一种基于l1最小化理论的数据重建方法,该方法通过获取投影矩阵重建稀疏的原始数据。首先,从理论上分析准确重建原始数据需满足的条件。然后,设计一种基于原始对偶内点法的数据重建算法,通过牛顿迭代实现稀疏数据的重建,指出在恶意模型中攻击者可以通过获取投影矩阵来准确重建稀疏的原始数据,导致原始数据隐私泄露。在人工和真实数据集上的实验结果表明,不需要任何原始数据样本,在已知投影矩阵的情况下,基于l1最小化理论的数据重建方法能够准确的重建稀疏的数据记录,传统的随机投影数据扰动方法在恶意模型中存在隐私泄露风险。其次,针对恶意攻击者重建原始数据导致的隐私泄露问题,提出一种实现差分隐私保护的噪声投影数据扰动方法。该方法通过在传统的随机投影数据扰动的基础上引入了噪声扰动来提高隐私保护水平。首先证明该噪声投影扰动方法满足差分隐私模型的定义,然后对扰动数据的可用性进行理论分析,说明该方法能够保护数据在欧几里德空间的相对位置关系。其次,设计一种噪声投影数据扰动算法以实现面向协同数据挖掘的差分隐私数据发布。最后,通过在人工和真实数据集上的实验分析表明:在已知投影矩阵的数据重建技术的攻击下,噪声投影数据扰动方法能够明显提高隐私保护水平,防止数据重建,并且能够保证扰动数据在基于近邻的数据挖掘方法中的数据可用性。再次,针对大规模高维稠密数据隐私保护计算量大的问题,提出一种基于全域散列函数的稀疏投影数据扰动方法,该方法利用投影矩阵的稀疏性降低数据扰动的计算量。首先构造一种随投影维数的变化,投影矩阵的稀疏度自适应变化的稀疏随机投影数据扰动,然后,具体设计一种根据用户给定的数据失真度阈值,进行稀疏投影数据扰动的算法。其次,从理论上对数据安全性和数据可用性进行分析。最后,通过在人工数据集和真实数据集上的实验分析说明:稀疏投影数据扰动方法能够保证数据的安全性和可用性,同时,与传统的随机投影扰动方法相比,计算量明显降低。最后,针对分布式数据流的异步实时更新问题,提出一种异步实时数据扰动方法。该方法首先构建面向分布式数据流挖掘的隐私保护数据发布模型,然后设计一种基于随机投影的满足异步实时更新的数据扰动,并且从理论上分析该方法满足数据异步实时更新。其次,基于构建的模型和异步实时数据扰动方法,设计一种隐私保护数据发布、传输和整合的数据收集机制,以及一种实现异步数据流扰动的具体算法。之后,基于以上研究,具体针对轨迹数据流提出一种隐私保护的相似轨迹挖掘方法,包括一种基于异步数据流扰动方法的用户端的轨迹数据转换算法,以及一种利用扰动数据进行相似轨迹挖掘的算法,并且从理论上对数据安全性和可用性进行分析。最后,通过在真实数据集和人工数据集上的实验分析说明:用户端数据转换算法的执行时间短,能够满足实时更新要求。服务端相似轨迹挖掘算法的执行时间明显低于同类算法,并且挖掘结果的准确度也与同类算法相当,说明算法适用于数据流并且具有很好的数据可用性。

其他文献

尚志市农机化发展的对策研究

近年农机发展一直呈稳定增长势态,但我市的农业机械大多数还停留在中小功率、单机、结构简单、技术含量低的低端产品上,发展势头缓慢,通过政府扶持力度、创新土地经营权流转

期刊

加快农机化发展Accelerated Agricultural mechanization Development

优质燕麦促进新产奶牛的经济效益研究

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

优质燕麦新产奶牛饲喂比例经济效益

烟草镰刀菌根腐病病菌致病粗毒素的研究

本试验测定了经尖孢镰刀菌（ Fusarium ox ys porum ）和茄病镰刀菌（FIsolani）粗毒素浸泡后烟草幼苗抗病相关酶系的活性及细胞膜透性的变化，以研究毒素对烟草的致病作用。结果表明，引

期刊

烟草镰刀菌粗毒素

新时代下地方应用型高校民航英语类课程教学改革探索——以滨州学院外国语学院为例

新时代下,地方应用型高校结合自身实际,开展了一系列的教学改革。滨州学院正向着建设以航空为主要特色的高水平应用型大学的目标迈进,滨州学院外国语学院积极探索新时代下民

期刊

新时代民航英语教学改革

混龄游戏中幼儿交往能力的发展策略及教师指导

交往是人的需要，教师要引导幼儿参加各种集体活动，通过交往，人们能够互相交流信息和感情，养成对他人、社会亲近、合作的态度。幼儿时期的交往能促进幼儿更好地适应社会和生活。因

期刊

混龄游戏幼儿交往

洛建80台压路机出口斯里兰卡大单签订

日前，洛建80台压路机出口斯里兰卡大单尘埃落定，洛建之所以从众多企业中脱颖而出．主要得益于在斯里兰卡良好的用户基础．及拥有型号最全的压路机产品。

期刊

斯里兰卡压路机出口

关于企业财务管理评价涵义的思考

［摘要］文章对企业财务管理的活动内容和评价在管理循环中的主要作用进行了分析，　　探索性地概括了企业财务管理评价的涵义，并厘清了企业管理评价和企业财务管理评价两者之间的关系，为开展企业财务管理评价的研究打下坚实基础。　　［关键词］企业财务管理评价企业财务管理评价企业管理评价　　　　随着国际金融危机的扩散和蔓延，我国企业受到的消极影响日益加深。部分企业因为受市场需求衰竭、各国贸易保护主义抬头

期刊

企业财务管理评价企业财务管理评价企业管理评价

基于医学图像的关节软骨分布测量及骨自动分割关键技术

医学成像技术和计算机技术紧密结合使计算机医学影像辅助技术在骨关节炎等疾病的诊断和治疗等方面发挥巨大作用。高分辨率和高信噪比的MR及CT骨关节医学图像中含有大量图像的

学位

多层次自动分割法线方向校正体素跟踪校正基于误差模型三维厚度校正B样条DGVF蛇模型

面向开源社区的开发者群体行为分析方法

开源软件开发基于自组织、松耦合的开源社区,开发者分布在全球不同位置,进行相对独立的软件开发,开发者的立项、讨论、评价、修改、测试等行为,主要是通过互联网相互沟通、讨

学位

复杂网络开发者开源软件群体软件工程

子宫动脉化疗灌注加栓塞联合宫腔镜治疗特殊部位妊娠3例报告

1病历摘要例1：女,27岁,孕1产0,停经1个月余,彩超提示：宫颈管内见长10mm妊娠囊,内见卵黄囊及胎芽、胎心。血清人绒毛膜促性腺激素（血HCG）：5954.5 mIU/mL。临床诊断：宫颈妊娠。行双侧

期刊

子宫动脉化疗灌注加栓塞宫腔镜特殊部位妊娠

基于随机投影数据扰动的隐私保护技术研究

与本文相关的学术论文