社会网络数据发布中的若干隐私保护问题研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:lzd_1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络是社会个体成员之间因为互动而形成的相对稳定的关系体系。电话呼叫网络、电子邮件发送网络、科学家合作网络、社交网站形成的在线社会网络等都属于典型的社会网络。随着信息技术的高速发展和Web2.0应用的广泛普及,大量的社交网站被建立和使用。人们越来越热衷于对社会网络进行研究,社交网站积累的海量数据也为社会网络分析提供一个好的平台和数据支持。值得注意的是,社会网络中大部分信息与个人生活密切相关,其中很多涉及到个人的敏感信息,例如,个人的疾病信息、个人收入、婚姻状况等,这些敏感信息被不法分子掌握容易做一些违法行为。于是,人们越来越关注自己的敏感信息在社会网络中是否得到有效保护。各科研机构和众多研究学者越来越重视社会网络的隐私保护。基于进行发布的社会网络数据的隐私保护已经成为科研热点。  传统的关系数据发布的隐私保护已经得到广泛研究,这种隐私保护主要保护表格数据中元组的敏感属性,元组之间没有联系。社会网络数据的隐私保护操作的是图数据,由于社会网络的敏感信息与攻击者的背景知识更多元化,关系数据的隐私保护方法不能直接适用于社会网络数据的隐私保护。  本文研究社会网络数据的隐私保护方法,主要研究工作和成果如下:  (1)社会网络的节点敏感属性保护  本文提出了图l-diversity规则,满足该规则的匿名图可以抵御针对节点敏感属性的概率攻击;设计了节点敏感保护的五钟算法:Partition算法、AdjustGroup算法、RedirectEdges算法、AssignResidue算法、图l-diversity算法,其中,Partition算法用于节点分组,AdjustGroup算法使组内节点度数一致,RedirectEdges算法通过重定向边操作降低匿名代价,AssignResidue算法用于处理剩余的特殊节点组,图l-diversity算法使用以上四种算法完成数据的匿名;基于两个数据集进行实验,与其它匿名方法比较了算法程序的执行时间、匿名图的平均路径长度和聚类系数。  (2)社会网络的敏感边保护  针对社会网络的敏感边保护,把节点度数纳入攻击者的背景知识;提出了敏感安全性条件的规则,并证明该规则可以有效保护社会网络的敏感边;设计了敏感边保护的三种算法:SNP算法、NNT算法和NEA算法,其中,SNP算法用于敏感节点分组,NNT算法处理节点数小于k的节点组,NEA算法通过添加非敏感边使组内节点度数一致;基于两个数据集进行实验,计算了算法程序的执行时间、匿名图的平均路径长度、匿名图的聚类系数、聚合网络1跳查询和2跳查询的错误率。  (3)社会网络数据多次发布的边保护  针对社会网络数据多次发布的边保护,考虑社会网络演化过程中节点删除和边删除的情况;提出了动态安全性条件的规则,并证明在数据多次发布的背景下,该规则可以有效保护社会网络的边;设计了动态边保护的DEP算法;基于两个动态数据集进行实验,计算了算法程序的执行时间、聚合网络1跳查询和2跳查询的错误率。
其他文献
高层次综合(HLS,High-levelSynthesis)工具将时序或半时序的用高层次语言书写的行为级程序编译成寄存器传输级(RTL,RegisterTransferLevel)的硬件描述,从而加速超大规模集成电路
管理信息系统在企业的信息化过程中具有重要的作用。管理信息系统经过长期的发展,已经发展到C/S模式和B/S模式相结合的阶段。随着Internet/Intranet的发展,B/S模式必将成为管理
主动网络引入了新型的灵活的网络服务范型,而广义的主动网络需要进一步研究不同层次主动网技术.移动代理技术具有主动包的特征,为研究应用层主动网络的研究提供了新方法.首先
字幕机是一种为电视画面叠加文字、图形及动画等的专用计算机设备.字幕机系统广泛应用于各级电视台的电影、电视后期制作中,可以给电影、电视添加各种各样的动态和静态字幕.
针对企业协作对CSCW提出的新要求和现有研究的不足,本文从深入分析企业协作关系的特征入手,总结了企业协作演变的一般规律。在此基础上,研究了处于动态联盟阶段的企业的协作关系
随着计算的网络化、移动化和多样化,由需求、结构变化引起的适应性问题越来越突出.为了提高软件适应上述变化的能力,该文以软件生存环境为问题产生的大环境,在构件、构件连接
远程桌面技术是云计算环境中提供桌面应用服务的支撑技术之一。高分辨率的桌面和日益丰富的应用程序界面给远程桌面终端的图形处理能力带来了挑战。本文结合远程桌面应用程序
该文面向自然语言问答系统(QA)研究了基于知网的汉语词语义相似度计算问题.具体来说,研究了以下四个方面的内容:1、详细介绍和分析了知网层次网络结构,比较了知网和其他语义
本文回顾了网络管理的起源和发展历程;从网络管理的一般模型结构,系统功能结构和体系结构方面具体分析了网络管理,并具体的分析了各种网络管理模型的优缺点;详细的分析了SNMP
该论文所研究的内容"地学空间信息三维可视化"是中国地质科学院矿产资源研究国家高科技计划(863)项目"地学空间信息三维智能分析与可视化技术"(2002AA125160)的子课题.该课题