基于向量模型的加权社会网络发布隐私保护方法研究

被引量 : 8次 | 上传用户:stevenyhiker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络是社会个体间因互动而形成的相对稳定的关系体系,是多种社会现象的表示模型,是复杂网络中最具代表性的现实网络之一。随着社交网络数量不断增加,越来越多的社会个体在社交网络注册,大量个体的信息被收集、获取。为满足科学研究、数据共享等需要,数据收集者需对社会网络数据集进行发布,由于数据集中包含个体的敏感信息,数据发布使个体的隐私面临泄露的风险。随着公众对隐私认知不断提高,隐私泄露问题已成为数据发布的主要障碍,为确保社会个体的隐私安全,在社会网络发布时需进行隐私保护处理。目前,已有的社会网络发布隐私保护研究成果大都针对无权网络。在无权网络中,社会个体间的连接属于布尔关系,只能说明个体间是否存在相互作用,对个体间相互作用的强度差异却无法标识。越来越多的社会网络实证研究表明,社会个体间存在着耦合强度不同的连接,并不完全是布尔关系。比如人与人之间的亲疏关系、Internet网络上的带宽、航空网络中机场间航班的数量或者座位数、科学家合作网络中科学家间的合作次数等都是影响网络性质的重要因素。因此,在社会网络的拓扑结构中引入衡量节点间耦合程度的物理量非常必要,即在两个节点间的连边上加一个权值,以衡量两个节点间关系的强弱。加权社会网络由于边权重引入,使得网络中包含的信息要比无权网络丰富,因此对加权社会网络发布的隐私保护进行研究是十分必要而有意义的工作。本文针对加权社会网络,提出采用基于向量模型的局部扰动策略设计隐私保护方法实现数据发布,具体内容如下:(1)提出了依据隐私保护质量和发布数据效用两个性能指标界定加权社会网络的发布场景,并给出了具体场景的定义。对社会网络发布实施隐私保护,先要确定发布场景,明确攻击者的背景知识、发布数据的用途和需要保护的隐私信息,才能采取有效的保护策略,设计隐私保护方法。针对社会网络发布,衡量隐私保护方法性能的两个重要指标是隐私保护质量和发布数据效用。根据发布数据的特性及实际的发布需求,数据发布者可能面临三种选择:是在获得可接受的隐私保护质量前提下,尽可能地提高发布数据效用;二是在获取可接受的发布数据效用前提下,尽可能地提高隐私保护质量;三是兼顾隐私保护质量和发布数据效用,希望取得二者的折中。本文针对三种发布选择确定了三个发布场景,在每个发布场景中,选取加权社会网络的节点(包括节点间连边的权重)作为隐私信息,发布数据的用途是进行网络结构特征分析(重点关注平均路径长度、平均聚类系数、权重分布),拟定攻击者分别拥有三种关于节点的背景知识(度、子图、边权重)。(2)提出了采用向量作为加权社会网络的发布模型。以图的边空间理论为基础,采用向量描述加权社会网络,为降低向量维数,采用基于节点的随机分割和聚类分割两种方法构建加权社会网络的向量模型。通过分割将加权社会网络表示为若干个子图,用向量表示每个子图,将所有子图的向量构成的集合作为加权社会网络的发布模型。分割子图与节点数量相同的稠密图相比属于稀疏图,通过对分割子图的向量进行扰动,实施对加权社会网络的局部扰动策略,进而实现加权社会网络发布的隐私保护。(3)针对提高发布数据效用的需求,提出了采用基于向量相似的随机扰动方法实现加权社会网络发布。该方法以加权欧氏距离作为向量相似的度量标准,根据发布者选定的阈值构建子图向量的发布候选集;从子图的向量候选集中随机选取向量构建加权社会网络的发布向量集;根据发布向量集构建最终的加权社会网络发布集。提出的方法能够迫使攻击者在一个向量发生概率相同的庞大结果集中进行重识别,增加了识别的不确定性和子图候选向量集中向量的相似性,进而最大限度地保证了发布社会网络与原始社会网络的相似性,提高发布数据效用。(4)针对提高隐私保护质量的需求,提出了采用基于差分隐私模型的向量映射方法实现加权社会网络发布。该方法利用差分隐私模型可实现隐私信息强保护的特征,针对加权社会网络设计了满足差分隐私的查询模型—WSQuery, WSQuery模型可捕获加权社会网络的结构,以有序三元组序列作为查询结果集;依据WSQuery模型设计了满足差分隐私的算法—WSPA,WSPA算法将查询结果集映射为一个实数向量,通过在向量中注入Laplace噪音实现隐私保护;针对WSPA算法误差较高的问题提出了改进算法—LWSPA,LWSPA算法对查询结果集中的三元组序列进行分割,对每个子序列构建满足差分隐私的算法,降低了误差,可满足发布数据的效用需求,提高隐私保护质量。(5)针对兼顾隐私保护质量和发布数据效用的折中需求,提出了采用基于随机投影的向量映射方法实现加权社会网络发布。该方法将加权社会网络用高维向量进行描述,应用随机投影技术的低失真映射将原始高维向量集进行降维操作得到低维目标向量集,通过数据降维即可实现去除冗余又可通过降维转换采用数值畸变方法实现隐私信息保护。在基本向量集随机投影方法的基础上,为避免随机投影转换矩阵泄露导致原始数据集被重构,提出了改进的向量集随机投影方法,采用了两个随机函数地组合构建随机矩阵元素,并证明了利用该矩阵实现地随机映射满足Johnson-Lindenstrauss引理的条件,该方法在提升隐私保护质量的同时能获得较高的发布数据效用,可实现隐私保护质量和发布数据效用的折中。(6)针对提出的基于向量模型的三种隐私保护方法在六个真实数据集上进行了仿真实验,并通过与已有算法进行实验对比,分析了每种方法的性能,验证了所提出方法的有效性。对基于三种隐私保护方法实现的算法执行时间进行了分析;选取了与提出的三种隐私保护方法相关的六个算法结合具体隐私攻击进行了实验对比,从基于度、基于子图和基于权重的三种背景知识的节点识别攻击测试了算法的隐私保护质量;从平均最短路径、平均聚类系数和权重分布三个结构特征参数的效用测试了算法的发布数据效用。根据实验结果及分析可知,提出的三种隐私保护方法可满足各自发布场景的需求,能较好地平衡隐私保护质量和发布数据效用的关系。
其他文献
我国的文学语言发展到清末时期形成了白话与文言共存的局面,这一现象对翻译界产生了一定影响。对于晚清民初的翻译家来说,翻译语言的选择则是他们必须面对的一个严峻问题。20
近10年有关幼儿园多媒体教学研究的文献资料显示:利用多媒体技术可以有效地促进教学,调动幼儿参与学习,提高教学效率,但在实践中存在着教学观念有偏差,管理松懈,硬件配备、软
党的十八大以来,国内主流媒体顺应传媒格局调整特别是新媒体迅猛发展趋势,在习近平总书记新闻报道中做了大量卓有成效的创新探索。主流媒体如何进一步聚焦内容创新、锻造传播
本文阐述了卷积神经网络的基本概念,并基于此引出全卷积神经网络和带孔卷积等卷积神经网络,对其含义、优缺点及其在图像语义分割中的应用进行了进一步的介绍和总结。本文阐述
创意改变生活,创意同样也是电视节目制作和发展的生命和灵魂,在多种多样的电视节目制作手段中,字幕的表现方式至关重要,而字幕字体的设计和创意在整个字幕设计中占着非常重要
在室温条件下,利用超声波,以硫酸钠和氯化钙为反应物,以乙醇和氯化镁为改性剂,制备了硫酸钙晶须。用X射线衍射(XRD)、场发射扫描电镜(SEM)等对制备的样品进行了表征。结果表明:反
研究机动目标跟踪过程中机动频率的自适应调整方法,使其值更加符合目标的实际机动状况.根据卡尔曼滤波残差是否符合零均值正态分布,判断目标机动频率是否发生改变,并采用简化
在交替传译中,缺乏逻辑的源语信息往往会给译员带来翻译上的困难。此外,尽管译员做了大量的译前准备,在翻译的过程中仍会遇到不熟悉的专业术语。为优化口译质量、保证交际效
<正> 一正是对照着这一漫长而又曲折动荡的时代背景,命运使我们的主人翁来往于中国的农村与中国的城市之间,然而,城市与农村仅仅是充当了陪衬的角色,真正的主角则是一位女性
明代賈坊托宋濂、屠隆之名編刻的《篇海類編》是一部收字頗豐,注音釋義詳實的楷書字典。其中有許多異體字和冷僻字往往不見於其他字韻書,但《康熙字典》《漢語大字典》等大型