【摘 要】
:
近几年来,数据挖掘、隐私保护、深度学习和机器学习等技术越来越成熟,市场上的企业可以从用户中收集数据,并从中挖掘出具有价值的信息,从中分析出用户的喜好进而开始精准的服务,实现其商业价值。但是与此同时,在收集用户数据的过程中,数据中也包含了大量的个人敏感的隐私信息,这些信息可能会被不法分子加以利用,用来从事网络诈骗或电话诈骗等违法犯罪行为。而差分隐私作为当前隐私保护中有效的保护机制之一,通过向隐私信息
论文部分内容阅读
近几年来,数据挖掘、隐私保护、深度学习和机器学习等技术越来越成熟,市场上的企业可以从用户中收集数据,并从中挖掘出具有价值的信息,从中分析出用户的喜好进而开始精准的服务,实现其商业价值。但是与此同时,在收集用户数据的过程中,数据中也包含了大量的个人敏感的隐私信息,这些信息可能会被不法分子加以利用,用来从事网络诈骗或电话诈骗等违法犯罪行为。而差分隐私作为当前隐私保护中有效的保护机制之一,通过向隐私信息中加入噪声来对查询结果进行随机化处理来达到保护用户隐私的目的。其中,本地化差分隐私是差分隐私保护机制之一,与中心化差分隐私不同的是,本地化差分隐私可以在没有可信任的第三方数据收集器的情况下来完成对数据的收集和对数据进行加噪。用户可以在本地完成对隐私加噪的过程,免除了第三方的参与,从而可以避免由第三方泄露隐私的危险,因此,在保护用户隐私方面,本地化差分隐私比中心化差分隐私更加有效。本地化差分隐私已经在近些年来运用到数据挖掘的多个方面,例如频繁模式挖掘、矩阵分解等。本地化差分隐私通过随机响应等机制来保护隐私,其中处理的数据集涉及到的隐私预算分配、隐私保护机制等,直接影响频繁模式挖掘结果的可用性,因此如何兼顾安全性和效用性是本地化差分隐私算法面临的一大挑战。针对这些问题,本文提出了一种面向本地化差分隐私保护的频繁项目挖掘算法—GFIM(Group-based Frequent Items Mining),在理论上证明了该算法满足ε-本地化差分隐私,并在三个真实数据集上的实验也验证了该方法对挖掘结果可用性的提高。与此同时,本文把分组的思想延续到另一种频繁挖掘模式——频繁序列挖掘,设计了一种满足本地化差分隐私的基于分组建立前缀树的频繁序列挖掘算法GFSM(Group-based Frequent Sequence Mining),利用分组避免了隐私预算的切割,提高了算法的挖掘精度,通过理论证明了该算法满足本地化差分隐私,并在两个真实的数据集上证明了该算法挖掘结果的可用性。
其他文献
为了确保产品质量,测试是集成电路(IC)制造过程中必要的步骤之一。为了方便测试,提出并广泛采用了扫描链设计。然而,扫描链技术在提高芯片可测性的同时,也给攻击者提供了对芯片进行旁路攻击的途径,使芯片安全性大大降低。差分密码分析攻击作为芯片旁路攻击的一种典型手段,严重威胁了加密芯片的安全性,也是本文主要讨论的一种攻击方式。本文针对差分密码分析攻击提出了一种基于明文分析的自适应扫描链技术,其中,明文分析
近年来,由于无人机具有成本低、移动灵活、容易操作等优点,在军事以及民用领域得到了广泛的应用。同时,对无人机通信技术的研究也成为当前无线通信领域的热门方向。无人机通信与传统的地面蜂窝网络相比有着不可替代的优势,能够完成更加复杂的网络任务,应对各种应急通信场景。然而,当前频谱资源紧缺的现状无法满足快速增长的数据流量需求,并且静态频谱分配机制导致频谱资源未得到有效的利用。因此,如何在有限的频谱资源下提升
人机交互控制接口作为机器人轮椅的关键技术之一,对用户与轮椅间的和谐协作控制具有至关重要的影响。传统的电动轮椅使用操纵杆控制轮椅移动,对于肢体有障碍的用户来说难以实现;利用用户仅存的技能控制轮椅移动,但是长时间维持一种姿态会导致用户疲劳,且不经意的姿态改变会引起轮椅行驶路径发生突变,造成不必要的安全隐患;利用机器人轮椅自主导航方式,为用户提供过度的帮助会导致用户丧失仅存的控制技能。解决此类问题就是要
如今,社交网站已经成为人们网络沟通的重要方式。然而因为开放性和便利性,且相较其他网站门槛比较低,社交网站成为谣言滋生和广泛传播的最佳平台。谣言通常是不实的信息,容易引起人们社会恐慌的情绪,对社会的健康发展和国家进步非常有害。谣言检测是一个热门的研究课题,这项技术广泛应用于各种社交网站,如Facebook、Twitter和Weibo。现有的谣言检测技术主要分为两类:一类是传统的机器学习方法,如基于用
伴随广大民众对无线局域网需求的进一步提高,无线局域网相关标准也在不断地研究中。从最初定义在低频段(2.4/5GHz)的IEEE 802.11a,802.11b和802.11g标准,及应用广泛的802.11n、802.11ac,数据传输速率在进行不断突破的同时,无线局域网整体系统性能也得到明显优化。但由于低频段的频谱日趋紧张,现有的频谱资源已不再满足用户日益增长的需要,因此无线局域网开始应用于高频段
配电网作为整个电力系统网络的末尾电力网络单元,承担着根据用户的需求分配电能的作用。当配电网中的脆弱线路或者节点发生故障时,整个配电网的安全性以及可靠性都会受到影响。若不及时发现并修理,很可能扩大故障范围,最终导致大停电事故。目前针对电网的脆弱性的研究大多在大电网中展开的,对配电网的研究成果较少,故对配电网的脆弱性进行分析是很有必要的。同时,在真正的配电网中,其所连接的负荷是随时间不断变化的,负荷的
随着信息技术持续快速发展,基于网络信息体系的智能化、自动化作业已广泛普及。公安机关科技信息化部门正适应时代变化,将主要警务业务迁移至网上、云端,目前已经应用的网上警务办公方式通常被称为“电子警务”。作为电子警务核心功能之一的旅馆业管理系统,可以大量采集个人身份、活动轨迹、资金流动等重要治安信息,是社会治理大数据的重要来源,对于打击违法犯罪、维护社会稳定具有重要意义。本文通过对“电子警务”和“旅馆管
吡咯并吡咯二酮(diketopyrrolopyrrole,DPP),是一种常见的分子构筑单元,具有强的π-π共轭结构,其平面化结构易于形成氢键,使得π-π电子云的叠加得以促进,从而有利于实现高的电子迁移率;另外,其内酰胺结构使得分子本身具备较强的吸电子能力。DPP因其分子结构具有高度平面化和高的迁移率等特性,而广泛应用于有机光电领域。DPP常作为空穴传输材料(电子受体)应用于有机光伏(Organi
石墨烯的成功制备证明了二维材料在常温下能够保持稳定,引发了人们的广泛关注。由于二维材料具有独特的结构和性能,被认为可以应用到未来电子与光电子领域中。随着现代科学技术研究的不断深入,研究人员发现结合两种二维材料组成的异质结构可以进一步改善单一材料的性能,并且具有独特的光学和电子性能。因此,探索由两种或几种二维材料叠加构成的二维异质结构成为了材料领域研究的热点。本文中使用材料模拟软件Materials