基于时序行为挖掘和隐私保护的协同过滤推荐算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ray361
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的兴起,互联网上的用户和商品呈现了爆炸式的增长态势,互联网的快速渗透带来了海量的数据信息,而海量数据的产生使得用户无法在短时间内准确及时地获取所需的信息,信息过载现象愈发严重。在此背景下,推荐系统应运而生。推荐系统通过研究用户的兴趣偏好,进行个性化的计算,由系统发现用户的兴趣点,进而有选择地进行信息推送,引导用户的信息需求。由于推荐系统能够有效地解决信息过载问题,因而其得到了广泛的研究和应用。然而,近几年来,互联网的快速发展也给推荐系统带来了一些新的挑战。以此为背景,本文首先介绍了信息过载现象,以此引出推荐系统的产生和发展过程,接着介绍了目前主流的推荐算法,此后,本文以协同过滤推荐系统中的时序行为信息挖掘和用户隐私保护为研究点,提出了相应的解决方案,本文的主要研究工作如下:(1)提出了一种利用用户的时序行为挖掘用户和商品近邻关系的方法。该方法通过构建用户和商品的消费网络图,计算最近邻集合,得出相应的关系信息。由于时序信息相对于社交关系、标签信息更加容易获取,因而其适用范围更广泛。(2)将挖掘的关系信息应用到矩阵分解模型中,提出了基于时序行为的协同过滤推荐模型SequentialMF。该推荐模型将利用时序信息挖掘的最近邻集合融入到概率矩阵分解算法中,从而提高推荐算法的准确度。在此基础上,进一步提出了基于该模型的推荐框架,该框架能够在线下更新模型,从而快速在线上完成推荐,使得推荐系统的实时性得到提高。(3)提出了一种能够实现隐私保护的推荐机制GroupMF。该机制收集用户对群组的宏观评价信息,基于此粗粒度的数据,预测用户对具体商品的偏好,进而为用户推荐个性化的商品。由于并不需要用户对具体商品的评价,因而其在一定程度上降低了隐私泄露的风险。(4)通过实验验证了模型的有效性。实验表明,基于时序行为的推荐算法在准确度上比传统推荐算法有了进一步的提升;基于隐私保护的推荐算法虽然在一定程度上造成了准确度的损失,但是其仍然具有一定的推荐效果。除此之外,该方法所需要的数据更容易收集,数据噪音也较少。
其他文献
并行测试是指测试系统并行地对被测系统进行测试。通过并行测试能够减少测试时间以及其它开销,提高测试效率。TTCN-3语言的重要语言特性之一就是并行测试。传统协议测试中要
中国书法具有三千多年的历史,是中国重要的传统艺术形式,它沉载着中华民族的传统审美情趣、哲学思考和文化心理特质,是中华民族传统文化中的瑰宝。在CADAL书法资源库中有很多
随着大数据、4G高速网络时代到来,实时交互、成本低廉的网络事件对社会生活、政策法规、人民心态影响逐渐加深。事件监控、舆论引导等问题引起广泛重视。本文针对网络事件发生
伴随计算机技术的广泛使用,信息安全问题日益突出,信息系统安全越来越受到人们的重视。鉴于操作系统在计算机系统中所承担的关键作用,整个计算机系统的安全在很大程度上依赖于操
随着网络攻击种类越来越多样化、攻击手段越来越复杂,入侵检测技术日益受到重视。入侵检测是一种重要的网络安全技术,根据检测原理不同,该技术可被划分为误用检测和异常检测。由
隐蔽信道的研究是信息安全领域的一个重要课题。网络时间式隐蔽信道是众多隐蔽信道中的一种,它将网络中的正常协议包作为构造自身通信信道的资源,能够在不同安全级别的主机和
国际电信联盟做了一个调查研究,调查结果显示中国移动终端用户群体的数目居世界之首。在当下,3G网络技术已经在国内得到广泛的推广,并向着4G网络时代迈进,移动终端设备已经得
图像分割对感兴趣的目标区域进行边缘检测和提取,其提供的结果将直接影响到对目标图像的特征分析和理解,对后续工作有重要而深远的意义。但真实图像往往呈现出噪声大、边界模糊
人工蜂群算法是一种新型的元启发式搜索算法,它的实现原理是模拟蜂群在采蜜过程中所表现出的群智能行为来实现对实际问题的求解。由于该算法简单易懂、容易实现、鲁棒性强、
我国高速铁路发展迅速。作为快捷的交通工具,高速动车组得到了广泛的运用,其安全运行和维修工作变得越来越重要。我国借助先进的数据采集设备和计算机存储技术,随着时间的推移,产