基于Wasserstein自编码器的协同过滤方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：slik

【摘要】

：

目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,

【作者】

：

钟景斌

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

推荐系统协同过滤隐式反馈自编码器链接预测

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前,我们正经历着从信息时代到数据时代的变迁,运用数据时代大量的信息,可以为我们生活带来许多便利,然而如何去使用这些信息却成了一大难题。而推荐系统则可通过技术手段,利用数据信息帮助用户快速定位到目标信息或物品,使信息得到充分利用。然而,传统协同过滤推荐算法如潜在因子等模型的本质是线性模型,这些模型未能解决数据的稀疏问题以及线性模型的局限问题。因此,设计非线性深度神经网络模型成为推荐系统的重要研究问题之一。本课题在此背景下提出,主要研究如何建立有效的、非线性深度学习模型,从而能够解决大规模、稀疏数据的推荐问题。针对这一研究问题,本文提出了一种基于Wasserstein的新型自编码模型,来缓解数据稀疏问题以及线性模型的表达能力问题。在模型设计方面,论文基于Wasserstein编码器的结构特点,利用神经网络来捕捉隐藏非线性特征,并对模型结构进行改进,以解决推荐系统数据的稀疏性等问题。所提模型引入了稀疏正则化项、并对Wasserstein自编码的隐变量分布距离以及重构误差损失函数进行重新的设计。最后将改进的模型应用于隐式反馈的实验之上。同时,考虑到用户之间的相关性关系,为了将用户评分的相关性用于协同过滤推荐问题当中,本文对模型进行了拓展。论文从简单的无向、无环图出发,将用户之间的关系看成一幅图,根据用户之间的关系在自编码器模型中引入相关性,并以此为基础拓展到广义有环图的情况,并推导了具有相关性的新型自编码器模型。为了使模型预测结果更加准确和高效,本文在模型设计中使用负采样策略,并对模型的算法进行了优化,最后应用于链接预测问题之上。最后,论文在多个大规模、稀疏的数据集上进行隐式反馈推荐及链接预测的实验验证。实验结果表明,本文所提两种方法具有较好的预测精度,并对稀疏数据有较强的适应性,从而验证了所提模型的有效性以及鲁棒性。

其他文献

关键技术领域外资并购国家安全审查制度及其完善

随着新科技革命的迅猛发展,科技的第一生产力作用日益彰显,一国的综合国力主要取决于科技创新能力和发展潜力。很多国家都把关键技术的研发作为国家战略,重视通过吸引外资来

学位

外资并购关键技术国家安全审查外资监管

基于可验证随机函数的拜占庭容错共识算法的改进与实现

区块链技术是下一代云计算的雏形,有望像互联网一样彻底重塑人类社会活动形态,并实现从目前的信息互联网向价值互联网的转变。共识算法是区块链技术的核心,使得区块链可以在

学位

区块链可验证随机函数拜占庭容错以太坊

现实学者社区发现系统设计与实现

产学研合作促进了创新网络的形成,然而在推进产学研合作过程中,企业却很难获取高校学术团队信息。其中,学者群体数量庞大、企业与高校的信息不对称是导致问题产生的主要原因

学位

学术网络网络表示学习node2vec社区发现

极性分子表面滤波、聚束与存储的理论研究

冷分子领域经过二十年的发展,取得了很多令人瞩目的成就,并在物理、化学等诸多学科中有非常重要的应用。一系列制备和操控冷分子的技术也应运而生,例如分子的静电速度滤波、

学位

冷分子速度滤波器聚束器存储环蒙特卡罗模拟

开放性问题的答案评估方法

文本评估属于自然语言处理研究领域的任务之一,面对海量的文本数据,实现端到端的自动化文本处理和评估能够节省大量人力物力成本,极大提高工作效率。与此同时,通过计算机的深

学位

开放性文本评估注意力机制预训练语言模型数据增强

个人征信市场化法律对策研究

2018年2月23日,央行发布信息,百行征信有限公司的个人征信业务获得央行许可。这是央行颁发的首张个人征信牌照,标志着国内个人征信行业打破了由政府主导的局面,向更加市场化

学位

个人征信市场化法律对策

基于人体骨架的动作识别

在视频监控系统中,识别人们玩手机、摔倒或打架的动作是必要的。动作识别是人的三维运动信息,在真实的监控视频中快速准确的识别人的动作仍存在很多问题。为了解决这一问题,

学位

动作识别图卷积时间卷积注意力模型人体骨架物体骨架

面向心血管疾病辅助诊断的医学图像分割与分类算法研究

心血管疾病是目前最主要的公共卫生问题,医学图像在心血管疾病的医学临床辅助诊断中有着不可或缺的重要作用。白细胞分类计数作为心血管疾病初步诊查项目中一项意义重大的技

学位

心血管疾病医学图像深度学习白细胞分类心脏MRI分割

面向特定场景的视觉问题生成算法研究

近年来随着深度学习的快速发展,视觉问题生成(VQG)逐渐开始成为一项重要的研究内容,它的任务形式是对于输入的图像给出关于图像内容的一些问题,VQG在多模态对话、幼儿教育以

学位

视觉问题生成注意力机制特定类别问题生成

基于Paillier同态加密的区块链交易隐私保护的应用研究

随着新一代数字货币——比特币的兴起,其底层支撑技术区块链也受到社会的关注,并被认为是信息互联网向价值互联网转换的基石。但是区块链技术体系依赖于全局账本的公开透明化

学位

区块链交易隐私保护Paillier同态加密以太坊

基于Wasserstein自编码器的协同过滤方法研究

与本文相关的学术论文