【摘 要】
:
大数据时代,为解决信息超载问题,推荐算法在许多领域被广泛应用,发挥了越来越重要的作用。推荐系统使用用户与应用平台的交互记录、用户属性等数据过滤用户需求,但这些数据的泄露往往会暴露用户的隐私信息,引发恶意推荐等安全事件。将推荐算法与隐私保护机制相结合,可以在为用户提供精确推荐信息的同时,更好地保护用户隐私。本文提出了一种用户隐私保护的推荐算法Priv Item2Vec,将双向长短时记忆网络算法(bi
论文部分内容阅读
大数据时代,为解决信息超载问题,推荐算法在许多领域被广泛应用,发挥了越来越重要的作用。推荐系统使用用户与应用平台的交互记录、用户属性等数据过滤用户需求,但这些数据的泄露往往会暴露用户的隐私信息,引发恶意推荐等安全事件。将推荐算法与隐私保护机制相结合,可以在为用户提供精确推荐信息的同时,更好地保护用户隐私。本文提出了一种用户隐私保护的推荐算法Priv Item2Vec,将双向长短时记忆网络算法(bi LSTM)与基于item2vec的推荐算法结合,使输出结果具有时序性,提高了算法的推荐准确率;同时在传输过程中使用Paillier加密算法对商品及用户行为序列生成的表征数据进行重新构造,保护用户隐私数据。Priv Item2Vec算法首先将商品序列输入到item2vec模型中,得到静态嵌入结果,然后将静态嵌入结果输入到bi LSTM模型中进行训练,最终得出有时序性的商品表征数据。然后,使用Paillier加密算法对商品id及经由item2vec和bi LSTM训练后输出的表征数据进行重新构造,对用户隐私信息进行保护:1)根据同态加密算法的特性,在用户端生成随机数与商品id进行计算并将计算结果和随机数加密,构造伪商品id,同时发送到给服务器端。2)数据传到服务器端后,同样根据同态加密算法的特性计算得出真实的加密商品id,并从服务器端的映射序列中找到对应的商品项,利用余弦相似度计算方法依次将其他商品与目标商品计算向量相似度,最终利用堆排序算法对得出的相似度序列进行排序,得出要向用户推荐的TOP-K推荐序列并向用户端传递。3)用户端对得到的加密序列解密,得到真实的、要向用户推荐的结果。在推荐计算的过程中只有用户端保留加密算法的秘钥,因此服务器端也无法对其进行解密操作。为验证本文所提出算法的性能,在真实数据集Movie Lens上进行了验证,与常用的BNR,NCF以及基于item2vec的推荐算法进行了比较。Priv Item2Vec的推荐命中率、NDCG结果、精确率等指标均优于其他算法。在比较加密前和加密后的计算效率时,服务器端的平均处理时间差为0.148s,即Priv Item2Vec算法在实际应用过程中消耗的时间相对于整体运行时间几乎没有影响。本文所提出的基于时序性的Priv Item2Vec算法,通过引入长短时记忆网络算法,使得传统的item2vec算法具有了时序性,提高了推荐准确性;Paillier同态加密算法的使用,使得推荐算法执行过程中服务器端获取到的数据全部为加密数据或embedding后的向量数据,降低了数据可读性,防御了半诚实的服务器,避免了由服务器端数据泄露而带来的恶意推荐,同时也保护了用户端到服务器端数据传输过程的安全。未来的工作将探索在隐私保护推荐算法中融入社交网络因素的影响,关注不同亲密程度朋友的偏好对推荐结果的影响;同时考虑如何防御社交网络中半诚实或恶意的用户。
其他文献
随着网络技术的发展以及定位技术在人们生活中的广泛应用,基于位置的社交网络得到快速发展并逐步融入到人们的日常生活中。其中包含的地理位置信息为研究人们的行为模式,挖掘人们的移动规律,提供了丰富的数据支持。兴趣点推荐作为基于位置的社交网络的应用之一,在近年来受到很大关注。兴趣点推荐从用户的历史签到地点序列中,挖掘用户的兴趣偏好,从而为用户推荐其感兴趣的地点,省去了用户自己从众多地点中选取自己感兴趣地点的
归园田居(其一)陶渊明少无适俗韵,性本爱丘山。误落尘网中,一去三十年。羁鸟恋旧林,池鱼思故渊。开荒南野际,守拙归园田。方宅十余亩,草屋八九间。榆柳荫后檐,桃李罗堂前。暧暧远人村,依依墟里烟。狗吠深巷中,鸡鸣桑树颠。户庭无尘杂,虚室有余闲。久在樊笼里,复得返自然。赏析在我们年少的时候,或多或少都学过陶渊明的文章,甚至还背诵过他的《饮酒(其五)》——结庐在人境,而无车马喧。问君何能尔?心远地自偏
卷积神经网络(Convolutional Neural Networks,CNNs)凭借其较高的准确性在图像识别、自动驾驶等领域很受欢迎。随着大规模图像数据的产生以及相关应用场景的开发,CNNs对计算性能的要求不断提高。而且受到工艺发展等条件的限制,传统处理器执行CNNs的能效过低。因此,芯片开发人员利用CNN加速器来提高CNNs的计算性能。但是随着制程工艺的发展,芯片尺寸的缩小和集成度的提高在带
视觉系统是神经系统重要的组成部分,它使人类有了视觉功能,使我们能够与大自然交流。近年来,随着世界经济的发展,人们的生活水平逐年提高,加之全球范围内的人口老龄化加剧,糖尿病型视网膜病变的发病率也在逐年上升。糖尿病型视网膜病变属于糖尿病的并发症,临床表现为视物模糊,视力下降,如果长时间得不到有效的诊断与救治,最终可能面临失明的风险。与上升的发病率相对应的,是紧缺的医疗资源。不论是发达国家还是发展中国家
在不断增强我国综合国力的同时,也逐渐提升了我国人民群众物质财务,进而也在很大程度上改变了各个层面的消费方式和消费观念。正确消费方式以及消费观的培养是维持社会以及经济发展的重要一步。中学生作为国家未来发展的中流砥柱,其不仅是打造和建设未来世界的群体,同时也是引领未来消费的群体。对于物质消费如何予以平衡,促进生活水准逐渐提升,保持人类发展的可持续性,这是未来中学生群体需要面临的主要问题。注重中学生正确
物联网的出现及迅速发展使得各种设备及服务得以通过网络相互连接,例如web应用程序、智能设备等。而诸如5G、IPv6等通信技术的兴起再度降低了接入互联网的门槛,这使得物联网中互联设备以及服务的数量得到喷涌式增长。伴随着物联网实体的激增而来的是海量的物联网数据——物联网实体之间的交互交流产生了大量的实体交互数据以及驱动这些交互产生的人类需求。为了实现物联网数据的更细粒度地处理和充分地利用,进一步使各种
本文针对四旋翼无人机飞行中存在的复杂干扰情况,提出基于改进模糊滑模算法(Logical Framework with Side Conditions,以下简称LFSC)的飞行控制策略。本文对传统滑模算法、传统模糊滑模算法、LFSC控制算法、风沙两相流复杂环境分别进行了研究,消减滑模算法所产生的输入抖振,为后续提高四旋翼无人机的控制性能奠定了基础。本文论述了滑模算法抖振现象的产生原因及减小抖振必要性