基于矩阵分解的哈希推荐方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:du_go666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络服务的迅速发展,“信息过载”的问题经常出现:例如在电商平台,用户面对海量的物品列表应该如何做出选择,而企业又应该将哪些信息展示给用户,这类问题引起了专家学者的广泛关注。推荐系统应运而生,它在处理信息过载方面起着至关重要的作用,并广泛应用于各个领域,取得了巨大的经济效益和社会效益。基于矩阵分解的协同过滤根据用户与物品的历史交互挖掘潜在特征实现个性化推荐,是实现推荐的有效算法。然而,大规模的用户和物品使推荐系统面临严重的存储和检索效率的问题。哈希技术将物品和用户特征映射至统一的二值哈希码,在汉明空间中实现推荐过程,具有很高的存储和计算效率,是解决推荐效率瓶颈的一个有效方案。基于哈希的推荐方法以次线性或对数时间复杂度完成Top-K物品推荐,从而极大地提高了推荐效率,但是目前的基于哈希的推荐方法仍然存在以下局限性:(1)推荐系统中的物品冷启动问题一直是一个巨大的挑战。大多数基于哈希的推荐方法主要依赖于用户与物品的交互和单一的内容特征,而忽略了物品的多模态特征。当推荐系统没有与物品的交互历史或缺乏特定内容特征时,冷启动问题就不能得到很好的处理。(2)现有的哈希推荐方法都是基于批处理学习模式学习哈希码,一般是离线完成训练后再上线使用,不能实时更新模型,在处理大规模数据集时,内存消耗大,处理流式数据时效率低下。针对上述两个问题,本文的研究内容分为两部分:(1)为了解决推荐系统中的冷启动问题,本文提出一种面向物品冷启动推荐的离散多模态矩阵分解方法,首先,该模型提出了一种高效的一致多模态映射,利用多模态特征的互补性,将物品的多模态特征转化为统一的因子。然后,对物品的多模态特征和用户偏好同时进行离散矩阵分解,在一个共同的汉明空间中学习用户/物品的紧凑二值哈希编码。最后,为了有效地保持物品的相似性,该方法提出了一个语义结构正则化项,强制相似的物品在汉明空间中具有相似的哈希码。(2)为了解决哈希推线模型的在线学习问题,本文提出一种在线内容感知的离散矩阵分解方法,该模型设计了一个灵活的在线学习矩阵分解框架。当流式数据到达时,它可以采用一种动态更新策略来支持实时在线学习。在用户和物品各自的内容信息存在的情况下对它们进行哈希码学习,并施加平衡和去相关约束使哈希码紧凑且信息丰富,采用离散坐标下降算法逐位更新用户和物品哈希码。本文通过在三个数据集上进行实验,证明了所提出的两种基于矩阵分解的哈希推荐方法较之于现有的哈希推荐方法能有效的提升推荐结果的准确度。
其他文献
随着计算机视觉和互联网技术的不断发展,Logo检测技术在商业宣传、商标侵权检测和城市智能化交通等实际生活中的应用越来越广泛。在商业宣传领域,挖掘图片中的Logo信息进行品牌追踪,并通过分析用户对品牌的偏好进行个性化推荐,可以对品牌宣传起到巨大推动作用;在商标侵权检测领域,通过对Logo图像进行智能检索及识别,可以判定所申请的商标是否存在侵权情况,对产品Logo检测以判定产品是否为虚假产品,为知识产
学位
行人重识别是视频监控系统中的重要任务,旨在从跨区域的监控摄像头采集到的图像中检索出特定行人的所有图像或视频,实现目标行人重识别,并应用于安防建设、行人追踪和轨迹分析等相关任务中。由于巨大的研究和应用价值,行人重识别成为近年的研究热点。但摄像头分辨率和安装角度、行人行走姿势及光照差异等复杂因素,给行人重识别带来了挑战。本文基于深度特征嵌入对行人重识别进行研究,分别讨论了在可见光图像场景与在可见光和红
学位
随着互联网技术和移动终端的快速发展,多模态数据呈现出了爆炸式的增长趋势。如何准确且高效地检索这些多模态数据,以满足用户日益复杂的多模态检索需求,变成了一个重要挑战。无监督哈希技术具有良好的扩展性、低存储空间和高检索效率,它可以有效地用来支持大规模多模态数据的检索。现有的面向多模态数据的无监督哈希方法主要包括无监督跨模态哈希和无监督多模态哈希两种。无监督多模态哈希利用多模态数据之间的互补性信息,将它
学位
虚拟现实通过为用户提供视觉、听觉以及触觉等多感官的信息模拟与刺激,利用计算机生成能使用户沉浸其中的模拟环境。在虚拟场景中,如果用户能够以真实的行走方式漫游,可以极大的提高体验感和沉浸感。但是,往往真实空间受到场地大小和形状的限制,与虚拟场景的开放性相冲突。如何在尽可能小的真实空间中漫游大型虚拟场景是该领域的研究难点和热点。在虚拟场景中随意漫游的同时,保证用户在真实空间中减少碰壁次数、降低漫游时间和
学位
[目 的]通过上尿路结石患者的结石成分分析、代谢评估、尿路影像学检查,查找结石形成的相关病因,为预防治疗的开展提供临床依据。[方法]对2018年9月至2021年9月在我院接受治疗的374例上尿路结石患者进行代谢评估、结石成分分析和影像学检查,查找患者在代谢和尿路解剖方面存在的异常以及代谢异常的类型,分析结石成分与代谢异常的关系和结石形成与解剖异常的关系,明确每个患者结石形成的相关病因。[结 果]3
学位
近年来,作为一种新的出行方式,共享单车逐渐走进了大众的生活,有效地解决了居民出行的最后一公里问题,现在已经成了许多人出行必不可少的一种交通工具。然而,在实际运营过程中,共享单车系统也不可避免地存在一些问题,影响了用户的使用体验,其中一个突出的问题是许多共享单车站点的自行车供需不平衡。准确预测共享单车系统中的共享单车使用量有助于解决这个问题。基于这个动机,本文对如何有效提高共享单车系统中自行车使用量
学位
模糊认知图(Fuzzy Cognitive Maps,FCMs)作为模糊逻辑和神经网络相融合的产物,通过模糊反馈动力系统进行知识表示和因果推理。近年来,该智能模型已被广泛应用于医学诊断、管理决策、时间序列预测等诸多领域。并且,模糊认知图凭借其自身带有反馈机制的多输入/多输出图结构,在描述、预测、控制复杂非线性动态系统中有出色表现,也成为机器人、无人机等智能体控制领域的研究热点。但现有工作主要集中在
学位
家庭教育具有重要的教育功能,是学校教育、社会教育的基础和保证。2022年1月1日起开始实施的《中华人民共和国家庭教育促进法》规定,未成年人的父母或监护人应该和幼儿园、中小学校等密切配合,积极参加其提供的公益性家庭教育指导和实践活动,应当针对不同年龄段未成年人的身心发展特点,围绕子女的德智体美劳众多内容为指引,开展家庭教育。高质量的家庭教育要求家长应该拥有正确的家庭教育理念,自觉学习家庭教育知识,掌
学位
新冠肺炎的爆发,引发了人们对医疗健康问题的高度重视。有效的医疗调度对医疗事业的发展有重要的意义。论文在考虑体检者的准备时间和体检者在体检设备之间的切换时间的基础上,将医疗调度问题建模为柔性作业车间调度问题(Flexible job shop scheduling problem,FJSP)。针对医疗调度过程中的体检调度、门诊调度、手术调度问题,分别建立了混合整数线性规划(Mixed integer
学位
随着物联网(AIoT)的发展,各种各样的终端设备生成的视觉数据越来越庞大。这些视觉数据不仅需要供人类观看或理解,还会用于多种机器分析和决策任务,例如智能监控、自动驾驶等其他智慧城市中的应用。而传统图像编解码器往往仅针对人类视觉任务所设计,在图像编解码过程中会产生大量的压缩伪影,如模糊、块效应等,这些压缩伪影不仅会影响人类的视觉体验还会导致后续机器视觉任务性能的严重下降。与传统地图像编码方法相比,针
学位