社交网络的图数据隐私分析方法研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:asdfzxcvasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Facebook、QQ、微信等社交软件的普及,给人们的生活带来了极大的便利。通常将社交软件形成的关系网称之为社交网络,它是人们之间建立联系的一种方式。同时很多人在用社交软件进行交友聊天时,这些软件会记录用户大量的个人信息。因此,人们在享受这种便利的时候,个人的部分隐私信息也会泄露。近年来,研究者提出了很多隐私保护方法,如基于加密、匿名、数据失真等,目前最常用的是基于数据失真的方法,而其主要是通过添加噪声实现隐私保护,但这种方法不能完全实现社交网络的隐私保护,仍会出现很多的隐私泄露问题,如成千上万的网络诈骗电话。因此,除了设计更好的隐私保护方法外,如何说明这些隐私保护方法的效果也是目前研究的热点问题。通常将社交网络抽象成图进行研究,针对图数据,国内外研究者提出了不同的通过加噪实现的隐私保护方法,但也有研究者从相反的方向出发考虑隐私保护后的效果。由于社交网络隐私分析方法与隐私攻击方法十分相似,因此本文主要借鉴社交网络隐私攻击的方法研究社交网络的图数据隐私分析方法。一方面,加入一定的背景知识,利用贝叶斯推理的方法,解决如何识别社交网络中的某个个体的问题;另一方面,在不考虑背景知识的前提下,借鉴图像处理中的去噪方法,选择能够自动抑制噪声的维纳滤波方法,解决如何分析整个社交网络的问题。本文的主要工作如下:(1)总结了社交网络的图隐私分析过程,并归纳了目前现有的社交网络隐私攻击及隐私保护方法。另外,对常见的图隐私攻击方法进行总结,并将隐私攻击方法与隐私分析方法进行了详细的对比。(2)提出了一种基于贝叶斯的单节点识别的图隐私分析方法。针对识别社交网络中的单个节点,利用贝叶斯推理,设计了一种基于贝叶斯推理的隐私分析模型,并在该模型下提出了基于贝叶斯的图隐私分析算法PABR(Privacy Analysis based on Bayesian Reasoning),通过数据验证发现,设计的贝叶斯方法能够以一定的概率识别该节点,最后将该算法与具有同样背景知识的方法进行比较,发现PABR算法的识别率高于其他方法,但现实中更多的是关注整个社交网络,该算法仅研究了单个节点,未对整个社交网络进行分析。(3)提出了一种基于维纳滤波去噪的图隐私分析方法。为了对整个社交网络进行分析,借鉴图像处理中去除噪声的方法——滤波,选择能够自动抑制噪声的维纳滤波方法,提出了一种基于滤波的图隐私分析模型,并且在该模型下设计了基于滤波的图隐私分析算法GPAF(Graph Privacy Analysis based on Filtering),最后采用节点,边,平均度(AD),平均聚集系数(ACC),介数中心性(BC)和度分布作为度量指标进行分析统计数据,实验结果发现,算法的度量指标与原始图数据比较相似,说明该方法能够去除发布图中的部分噪声,也为隐私保护的研究提供了理论性的指导。
其他文献
目的:妊娠期糖尿病(gestational diabetes mellitus,GDM)是妊娠期最常见的代谢性疾病,目前世界各地对GDM的诊断标准不同,GDM发病率有很大差异,农村妊娠期妇女资料更是普遍缺乏。本研究主要针对青岛市郊区城乡孕妇,按照IADPSG2010年引入的新GDM诊断标准,对孕妇进行的OGTT筛查后,得到青岛市郊区城乡孕妇GDM发病率,并对孕妇及新生儿并发症、以及GDM相关风险因
车载自组织网络(Vehicular Ad-hoc Networks,VANETs)是车联网的一种实现,其中路由协议设计是VANETs实现可靠多跳传输的关键技术,也是VANETs的研究热点之一。在VANETs中,节点移动速度较快会导致网络拓扑结构变化快和连通性较差,以“存储-携带-转发”为模型的机会转发机制能够很好地适应上述复杂的交通环境。本文围绕VANETs网络数据传输开展相关研究,设计一种无需预
在前不久举行的第九届北京国际图书博览会上,活跃着民营书商的身影。这一现象表明,中国加入WTO后,与国有出版业一样,民营书业也在积极寻求合作,谋求新的发展模式。这一动向颇
金石堂书店副总经理杨秋福认为:1.书店不只是卖书,还背负着传播文化的使命,为了达到出版、发行、零售三赢局面,应该同心协力完成共生的概念,希望共同创造最终顾客所需;2.书店
[目的]获得与苦瓜抗白粉病基因紧密连锁的分子标记,为加快苦瓜抗白粉病新品种的选育奠定基础.[方法]以高抗白粉病野生苦瓜MC18为父本、高感白粉病苦瓜栽培种MC1-2为母本创建F
【目的】初步探究XC_3374基因在甘蓝黑腐病菌Xcc8004中的功能,为深入研究甘蓝黑腐病菌Xcc8004中L-天冬酰胺酶的功能奠定基础。【方法】从KEGG数据库内获取XC_3374基因的旁侧序
随着我国加入世贸组织,图书版权贸易空前活跃。据新闻出版总署的统计资料表明。仅2002年我国图书版权引进已达8000余项,与加入WTO之前相比,步伐明显加快。面对如此庞大的引进
读写分离是NewSQL数据库兼容传统关系型数据库以及NoSQL数据库各自优势的一种常用策略。这种架构下,基线数据被分割为多个分区分布存储于不同存储节点,更改数据存储于单个事
就在出版商努力从2002年的行业不景气中找寻未来可能恢复的迹象时,一份截止到9月30日这一季度的报告数字引起了广泛关注。 美国在线一时代华纳:收入上扬 世界上最大的媒体集
赶在北京国际图书博览会开幕之前,中国出版集团集合了所属的11家出版单位,联合向首都新闻媒体展示“版权贸易成就与形象”,对成立仅一个来月的中国出版集团来说,这一举动表明