基于跨模态相关性分析与自适应排序学习的推荐系统研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:joiner
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐模型是一种有效的信息过滤机制,它根据用户需求从海量数据中找出有价值的内容,并以多种形式推荐给用户,它的出现满足了不同用户的个性化需求,给企业和社会带来巨大效益。但推荐系统目前处于不成熟阶段,仍然存在数据稀疏、低可解释性、未充分利用特征间的跨模态相关性等问题。为此,本文基于上述存在的问题展开研究。首先,在原始Movie Lens数据集基础上,通过爬取电影文本和海报信息构建新的多模态数据集Movie Lens-100k-MPT和Movie Lens-1M-MPT。其次,分别从可解释性矩阵、跨模态相关性分析、对抗学习及改进排序学习函数等角度展开研究。本文具体工作如下:(1)基于可解释性贝叶斯个性化排序的推荐模型(Explainable Bayesian Personalized Ranking,EBPR):首先,根据Movie Lens数据集中用户与项目的交互数据构建交互表,计算项目间的余弦相似性,进而获取相似性较高的前N个项目,再根据交互矩阵生成可解释性矩阵,可解释性矩阵表示用户与项目邻域的交互概率。然后,基于最大似然估计,在贝叶斯个性化排序基础上引入可解释性矩阵,增加用户与项目邻域的交互,进而实现推荐。实验结果表明:可解释性矩阵可以为用户挖掘更丰富的项目信息,进而更准确地描述用户偏好,它在一定程度上缓解了新项目加入的冷启动问题。相对于BPR模型,EBPE模型的推荐性能有显著提升,EBPR模型具有一定的可解释性。(2)基于跨模态相关性分析的推荐模型(Cross-modal Correlation Analysis Adversarial BPR,CCABPR):围绕多模态Movie Lens-100k-MPT和Movie Lens-1M-MPT数据集,基于BERT模型提取互补性文本特征;基于SENet模型提取异构图像特征;基于gradKCCA和CCCA相关性模型分别挖掘异构BERT文本特征间和SENet图像特征间的相关性;设计对抗学习策略,对训练过程进行优化,更好地完成推荐任务。实验结果表明:与NMF、VBPR等主流基线相比,CCABPR类模型取得显著优势,说明文本特征、图像特征、跨模态相关性和对抗学习在推荐中都发挥了重要作用。其中,CCCA模型优于gradKCCA模型,该模型挖掘出的跨模态相关性更具判别性。此外,模型在Movie Lens-1M-MPT数据集上获得更大的性能提升,它较好地缓解了数据稀疏问题,提升了推荐性能。(3)基于跨模态相关性分析与自适应排序学习的推荐模型(Cross-modal Correlation Analysis And Adaptive Pointwise-Pairwise Learning Adversarial BPR,AABPR):在CCABPR模型基础上提出AABPR模型,即改进BPR模型中的成对排序损失函数,使模型根据项目对的交互关系自适应地选择逐点、成对或两者任意组合的排序函数,最终完成高质量推荐。实验结果表明:AABPR模型优于CCABPR、DMF、APR等主流基线,即自适应排序学习优于逐点型和成对型排序学习算法,它在推荐中扮演重要角色,推荐模型具备一定实用性。
其他文献
有机合成染料和有机微污染物(Organic Micro-pollutants,OMPs)作为水体中常见的有机污染物,由于其成分复杂且难降解等原因,排放入水体中对环境造成了极大污染,甚至会导致水生动物的内分泌变化及“三致”的危险。高级氧化技术作为目前在水处理过程中应用最为广泛技术对有机污染物具有较好的处理效果,UV/KMnO4高级氧化体系作为一种新的水处理技术,可以产生羟基自由基(·OH)和活性锰成
学位
流体在流道内流动时,流动的不均匀性促使流体与流道固体壁面之间的动量传递速率增强,从而导致流动阻力的急剧增加。这种表面摩擦阻力最终会造成能源资源的大量消耗,为了有效解决输送过程耗能过量的问题,众多减阻技术应运而生并得到了广泛推广和应用。聚合物添加剂减阻由于其减阻效果显著且容易操作备受青睐,它主要依靠将少量的长链高分子聚合物溶入流体中,改变流体的湍流结构,进而极大降低流动的摩擦阻力来实现减阻。为此,本
学位
近年来,随着人工智能的不断发展,移动机器人在各个领域得到广泛的应用。而估计当前位置是这些机器人的关键任务,称为机器人定位。定位是机器人技术中的一个重要过程,也是移动机器人领域的研究热点。基于概率定位算法主要有卡尔曼滤波定位、马尔可夫定位及粒子滤波定位。其中粒子滤波算法在处理非线性非高斯系统方面具有更高的准确性和鲁棒性,成为目前的主流算法。传统基于粒子滤波的定位算法存在概率系统模型构建和学习的困难和
学位
目的 探讨尿促性素联合克罗米芬治疗排卵障碍性不孕症患者的临床效果。方法 124例排卵障碍性不孕症患者作为研究对象,采用随机数字表法分为对照组与观察组,各67例。对照组予以尿促性素治疗,观察组予以尿促性素联合克罗米芬治疗。比较两组治疗前后各项性激素指标[黄体生成素(LH)、卵泡刺激素(FSH)、雌二醇(E2)、孕酮(P)]水平、妊娠情况及排卵情况。结果 治疗后,两组LH、FSH比较,差异无统计学意义
期刊
随着我国物质生活水平的逐渐提高,我国汽车保有量也逐年增加。尽管汽车给人民的生活和工作带来许多便利,但也带来了许多问题。如:交通事故、交通拥堵、乱停乱放和停车位资源浪费等。因此,为了解决这些问题,需要大力推动智慧停车场管理、辅助驾驶系统和智慧交通系统的发展。基于深度学习的车辆检测技术是计算机视觉中的一个热门研究方向,也是推动上述系统发展过程中基础且十分重要的技术。然而现有的车辆检测模型还存在很多不足
学位
目的 分析个体化护理对维持性血液透析高血压患者自我管理行为及依从性的影响。方法 根据随机数表法将2020年1月至2021年12月在本院救治82例维持性血液透析高血压患者分为观察组和对照组,每组41例。两组均采用常规护理,同时观察组另予以个体化护理。比较两组基线资料、自我管理能力、依从性以及血压水平。结果 两组基线资料对比(P>0.05);护理后观察组自我管理行为的改善情况相比对照组较好(P<0.0
期刊
矿石分选抛废中对计算机辅助技术的运用,可以有效提升精尾矿分类准确率和处理量。近几年,深度学习技术的运用对矿石分选抛废效果提升巨大,但是该技术的落地实现的前提是数量足够而且均衡的训练集,生成对抗网络的应用可能成为这一难题的解法之一。本论文通过对铅锌矿石X射线图像以及生成对抗网络的研究,提出了一种胶囊鉴别器-生成对抗网络,在一定程度上达到了数据增强的效果。以下是主要工作内容:1、制作矿石图像数据集。本
学位
随着生物信息学的不断发展,处理和分析海量生物数据对于药物开发、疾病诊疗、生物医学研究等多个领域有着积极作用。环状RNA(circRNA)作为一种具有共价闭环结构的新型内源性非编码RNA,可以从多方面调控基因的表达,被验证与人类复杂疾病之间存在潜在关联。目前已有的circRNA-疾病关联预测算法存在缺乏多源数据、没有高效聚合相似性网络特征、特征数据处理过平滑以及特征种类融合不充分等不足之处。为此,本
学位
目的 探讨终末期肾病血液透析患者并发高血压的相关影响因素。方法 本次研究为回顾性分析,将2021年8月至2022年8月收治并确诊的终末期肾病患者70例为研究对象,所有患者均进行血液透析,血液透析时间≥6个月,将血透期间是否发生高血压作为分组依据,将我分为发生组与未发生组。收集所有患者临床资料,记录其血压水平,并检测清C反应蛋白(CRP)、同型半胱氨酸(HCY)、血清磷(P)、血清钙(Ca)、血尿素
期刊
磺胺类抗生素在水环境中广泛存在且难以彻底处理,对生态环境产生了巨大威胁。硝酸盐(NO3-)和亚硝酸盐(NO2-)是自然界中重要的含氮阴离子,特别是在工业废水中浓度较高。它们可以通过紫外光激发,产生活性氧物种(ROS:·OH、O·-、O(~3P)和O2·-等)和活性氮物种(RNS:·NO2、·NO和ONOO-等)等,这些活性成分对水中有机物降解具有重要促进作用。但是紫外/NOx-体系对磺胺类抗生素的
学位