基于深度学习的推荐算法及其隐私保护研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:greatteset
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网的快速发展,大量的网上应用所产生的海量数据使用户越来越难以从中快速获取到最有价值的信息。推荐系统的出现给这一问题提供了有效的解决途径,然而传统的推荐算法越来越难以从当前稀疏的用户数据中提取到有用的信息。如何有效挖掘这些稀疏数据中存在的有用信息,成为了当前推荐系统面临的一个主要挑战。推荐系统在提供便捷的推荐服务的同时也面临着严重的隐私泄露问题。差分隐私作为一种能够提供更加严格和可量化的隐私保证的隐私保护技术已经被广泛应用于推荐系统中。然而现有的研究大多直接向需要保护的敏感信息中加入差分隐私噪声,这通常会引入过多的噪声,从而给推荐算法的准确度带来不必要的损失。如何在足够的隐私保护程度下使得模型的精度损失最小,成为了当前推荐系统的隐私保护面临的一个主要挑战。针对以上提到的两个问题,首先本文将深度学习技术引入到协同过滤算法中,提升了推荐算法对稀疏数据的处理能力。然后针对现有方法在隐私预算分配方面存在的不足,并结合深度学习算法的特点提出了一种更加合理的自适应差分隐私预算分配方法。主要工作如下:(1)针对传统的基于邻域的协同过滤算法准确度较低的问题,本文提出了一种新的邻域协同过滤算法。该方法利用深度神经网络以学习的方式获取用户(项目)之间的相似度,相比于传统的相似度计算方法(余弦相似度,皮尔逊相关系数等),该算法能够同时提取到用户(项目)之间存在的线性与非线性关系。通过实验发现,所提方法较传统方法在准确度上取得了显著的提升。(2)针对传统基于模型的协同过滤算法难以在稀疏数据中准确获取到用户(项目)的潜在特征的问题,本文提出了一种新的矩阵分解算法。该算法在矩阵分解的基础上引入深度神经网络结构,相比于传统方案,新方案中的神经网络结构能够挖掘到稀疏数据中存在的非线性关系。通过实验发现,该算法较传统的算法在准确度上取得了显著的提升。(3)针对推荐系统中存在的隐私泄露问题,本文对所提算法应用差分隐私保护技术。通过进一步研究发现,直接将原始的差分隐私方案应用到所提的推荐算法中会导致较大的模型精度损失。导致这一结果的原因是模型训练过程中的隐私预算分配不合理,因此本文提出了一种新的差分隐私保护方案,该方案能够根据深度学习算法的特点自适应地将隐私预算分配给模型的梯度参数。实验发现,相较于传统方法,在模型准确度相同的情况下,该方案可以提供更加严格的隐私保护程度。
其他文献
柳杨堡气田位于鄂尔多斯盆地西部,内蒙古自治区、宁夏回族自治区和陕西省的交界部位,具备巨大的资源量和开发潜力,是中石化重要的天然气勘探开发区之一。本文以“柳杨堡气田6.5亿方产能建设工程环境影响评价地下水专项评价”项目为依托,以柳杨堡气田为例对气田开发地下水环境影响进行了数值模拟研究。首先收集整理了研究区的前人研究资料,在此基础上对研究区进行了详细的有针对性的水文地质调查,全面掌握研究区地质与水文地
英语写作是体现英语运用能力的重要组成部分,在我国,英语写作一直是初中英语教学中的薄弱环节。初中九年级英语写作在考试中占15分,而且学生们在写作部分的失分率尤为高。所以如何有效提高学生的英语写作能力已经成为目前初中英语教学的一个重要课题。然而,目前初中英语写作教学却是英语教学中比较薄弱的环节。传统写作教学更多关注的是写作的结果,忽视对学生写作过程的教学。学生对英语写作学习兴趣不高,甚至畏惧英语写作,
多层网络之间相互依存、依赖的耦合关系相比单个独立的网络更能抽象出实际生活中的大型网络。但是,由于多层网络间存在的耦合关系必将导致整个系统网络的鲁棒性降低,并且研究表明,易受级联故障影响的多层网络之间的耦合关系也会增加。一旦某一层网络节点受到攻击而失效,进而发生网络层间的相互依赖故障传播。进一步,由相互依赖故障传播而由触发了网络层内的负载过载故障传播。如此传播过程不断的迭代传播,直到网络由于发生级联
随着我国经济体制改革程度逐渐加深,产业结构调整日渐成熟,进而使得技能型员工供不应求,但却也在一定程度上对其提出了更高的要求。纵观我国当前经济发展现状,企业为了能够适应发展大环境,必须加强在员工管理以及培训上的重视程度。虽然近些年间,公司员工的整体培训已经得到了较大程度的改善,但仍然存在诸多问题有待解决。例如存在缺乏系统的培训、培训制度不完善,缺乏专业的培训人员和内容等,企业与员工技能培训组织缺乏有
最近以来,世界形势不断变化,导致经济走势也随之起伏进入到一个新的阶段。我国企业的经济情况一方面受国际相应外部因素影响,不断变化;另一方面,因为内在转方式、调结构,经济增速放缓等内部因素影响,也导致部分企业发展速度减慢,利润减少,竞争加剧,遭遇了“寒冬”考验。在此情况下,企业如何扬长避短,保持自身的核心竞争力,补足短板,对企业以后的发展存亡至关重要。本文以烟台三环科技有限公司为研究对象,在企业核心竞
动静压轴承作为高效精密数控磨床中的核心功能部件,其性能的优劣直接影响到机床加工质量的高低。结合课题的具体要求,本文对用于高效精密磨床砂轮主轴上的液体动静压轴承进行了全面深入的研究:(1)基于流体润滑理论建立了求解动静压轴承稳态温度场分布的数学模型,并通过采用三维流体仿真分析软件FLUENT分析了主轴形状误差对轴承性能的影响。(2)使用FLUENT和ANSYSWorkbench两个软件对液体动静压轴
在污染环境中,粘附在土壤微孔(<2.5 nm)中的大分子不溶性重金属和有机污染物很难去除。腐殖质(humic substances,HS)和微生物均不能进入微孔与污染物接触以与它们反应。为了解决土壤微孔中污染物难去除的问题,我们需要引入腐殖酸(humic acids,HA)小分子量组分(low molecular weights fractions,LMWF)的小分子研究。由于腐殖酸可通过进
机动车交通事故责任属于实践中最常见的一类侵权责任,而机动车使用可能性丧失亦是这类侵权责任中最常见的情形。本文研究目的有二:明确车辆使用可能性丧失是否得以请求侵权的损害赔偿;若可以赔偿,赔偿范围如何确定。使用可能性的丧失请求损害赔偿必须满足侵权的构成要件。而有争议的是使用可能性是否属于受侵权法保护的权益以及使用可能性丧失是否存在可赔偿的损害。首先,使用人可分为所有权人和占有人,各自的利益必然不同。使
在计算机视觉领域,图像匹配是一项基本功能,在图像拼接、目标识别、视觉定位等应用中起着重要的作用。在多种主要的图像匹配方法中,基于尺度不变特征提取算法(Scale Invariant Feature Transform,SIFT)的图像匹配方法有着鲁棒性高的优势。但是,SIFT算法也有明显的缺点:算法复杂度高、计算量大,通用平台的计算能力难以满足实时处理的需求。本文介绍了基于SIFT特征提取算法的硬
阅读是英语听、说、读、写四项基本语言技能之一,学生的阅读水平体现了他们运用语言的综合能力。另外,阅读成绩在英语总成绩中占比较大,这也使得阅读教学在英语教学中显得尤为重要。随着全球网络信息技术的发展,人类从读写时代进入了超文本时代,这要求人们必须能够在不同形式的语言和不同的表达方式之间自由切换。在这一背景下,2017年颁布的英语新课程标准在语言技能中增加了“看”(viewing)这一技能,“看”(v