【摘 要】
:
推荐系统是工业界和学术界处理信息过载的主要手段,其通过分析用户和所推荐项目间的关系,或利用已有用户历史行为记录,帮助用户从海量数据中寻找可能感兴趣的信息。近几十年,推荐系统技术得到了长足发展,基于协同过滤、机器学习、深度学习的模型均已在现实生活中得到了广泛应用,但这些模型表达能力有限,且每次推荐都是按照固定策略,无法适应时刻变化动态的用户兴趣。其次,这些静态模型将每次推荐视为独立过程,没有考虑用户
【基金项目】
:
国家自然科学基金面上项目,61876141,超应答进化动态多目标优化及其应用,2019/01-2019/12; 陕西省自然科学基金重点项目,2019JZ26,用于数据流聚类的自适应进化动态多目标优化,2018/01-2021/12;
论文部分内容阅读
推荐系统是工业界和学术界处理信息过载的主要手段,其通过分析用户和所推荐项目间的关系,或利用已有用户历史行为记录,帮助用户从海量数据中寻找可能感兴趣的信息。近几十年,推荐系统技术得到了长足发展,基于协同过滤、机器学习、深度学习的模型均已在现实生活中得到了广泛应用,但这些模型表达能力有限,且每次推荐都是按照固定策略,无法适应时刻变化动态的用户兴趣。其次,这些静态模型将每次推荐视为独立过程,没有考虑用户行为的连续性,无法对信息进行充分利用。推荐过程本质上是推荐系统与用户交互的过程,其具有鲜明的交互性。深度强化学习技术因其良好的表达能力与决策能力,被广泛应用于机器人控制、自然语言处理等领域上。近几年,研究人员将深度强化学习与推荐系统相结合,构建了可以在与用户连续交互过程中不断优化推荐策略的动态推荐模型。这些模型虽然克服了静态推荐算法无法处理的用户动态兴趣变化的缺陷,但仍面临训练不稳定、样本利用率低等问题。本文针对基于深度强化学习的动态推荐系统展开研究,主要工作如下:1.提出一种基于SoftActor-Critic架构的稳定动态推荐方法。该方法首先基于用户长期与短期兴趣建模推荐系统的马尔科夫决策过程,使强化学习算法能够根据用户高分反馈行为积累用户长期稳定的兴趣偏好,在此基础上,结合循环神经网络设计了两个编码器来分别获取用户短期与长期兴趣的特征表达。最后,基于强化学习中的Actor-Critic架构设计整个框架,并引入鲁棒性强的深度强化学习算法SoftActor-Critic来训练模型。与已有算法相比,该方法在离线与在线的推荐场景下稳定性更好、推荐准确性更高。2.提出了一种基于Dyna框架与图卷积网络的动态推荐算法。深度强化学习算法应用在推荐系统上往往面临样本利用率低、用户反馈数据稀疏的问题。知识图谱作为辅助信息能提供丰富语义信息,可有效缓解用户反馈数据稀疏问题,该方法利用知识图谱来建模动态推荐系统的马尔可夫决策过程,并结合图神经网络构建强化学习智能体,以此来挖掘知识图谱中项目间的相关性,缓解样本利用率低的问题。另外,为了减少与真实用户的交互,该方法还引入强化学习中的Dyna框架来进一步提高样本利用率。通过仿真在线实验,证明了该方法样本利用率更高,在面临用户反馈数据稀疏能获得更好的推荐性能。3.提出了一种多智能体强化学习的动态推荐算法。该方法将推荐过程分为基于用户与基于用户群体的两个马尔科夫决策过程,并利用深度强化学习中的深度Q学习算法分别对其建模。模型拥有两个深度Q网络结构的智能体,关联全局的深度Q网络掌握着实时热点的变化,掌控当前流行趋势;相关用户个人的局部深度Q网络记录了用户个人兴趣的变化,获取当前用户个性化偏好。在用户冷启动的实验环境下的实验结果验证了所提出方法的能够有效提高推荐精度。
其他文献
微特电机在各种工业设备中扮演着重要的角色,起着动力供给的作用。永磁直流有刷空心杯电机作为微特电机,与传统电机相比其突出特点在于无铁芯、耗能低、体积小、重量轻、控制简单,采用电刷换向成本较低,使得这类电机在生产生活以及国防领域中有广阔的市场。目前空心杯电机已在智能制造、医疗器械、物流运输、军用装甲、太空勘测、民用交通等领域广泛应用。本文以企业实际需求和工程应用背景为牵引,以适用于镜头调焦的永磁直流有
航空发动机主轴轴承工作环境恶劣,早期的微弱故障会快速演变为严重故障,主轴轴承的早期微弱故障诊断是航空发动机安全性和预测性维护的关键技术。航发轴承体积大、结构复杂,不方便直接拆卸以检查损伤部位及损伤的严重程度,论文利用声发射技术实现轴承故障的原位检测与定位,论文首先提取轴承声发射信号的多个特征训练神经网络,完成故障源粗定位,为了进一步实现故障源的精确定位,论文搭建了实验平台,研究了阵列稀疏表示法,实
现代无线通信系统的快速发展对高性能、低成本、易于集成的紧凑型设备提出了越来越高的要求。微波滤波器作为通信系统不可或缺的组成部分,其性能对通信系统的整体运行至关重要,因此设计出高性能、低成本、高集成度的小型化滤波器成为了当前的研究热点。基于PCB板制成的基片集成波导(Substrate Integrated Waveguide,SIW)和基片集成槽间隙波导(Substrate Integrated
GaN电力电子器件具有高效率、小尺寸、低损耗的优势,近年来华为、小米等企业推出了100多款手机快充,并在电动汽车、激光雷达、包络跟踪方面实现了初步验证,展现了广泛的应用前景。高温、高压下GaN电力电子器件缓冲层漏电过大,限制了GaN材料在高铁动车和智能电网等中高压应用领域的应用。在此背景下,本文利用25%Al组分背势垒结构更好的2DEG限域性和垂直方向耐压能力,有效抑制了常温和高温下的缓冲层漏电。
航空、核工业等事业的不断发展使得对其内部电子仪器精密度、集成度提出了更高的要求。更小特征尺寸的晶体管为芯片带来了更高的计算能力更低的功耗乃至成本的下降。采用纳米级器件构成航空、核工业领域所用芯片十分必要,因而研究器件在核辐射或者宇宙射线等带有高能粒子累积轰击下的退化机理,为辐射加固提供理论支撑。其中器件的材料、工艺、辐照条件等成为引起器件退化的主要因素,本文将重点围绕这几个关键点采用仿真与实验相结
大规模多输入多输出(Massive MIMO)作为现代移动通信领域的一项核心技术,相较于传统的多天线技术,在系统容量和频谱效率等方面拥有明显的优势。然而,该技术所需的巨大数量射频单元将会导致极高的能量消耗和系统损耗。针对此问题,在基站侧射频单元使用低分辨率(1-3比特)的模数转换器(ADC)和数模转换器(DAC)可以有效降低系统能耗。本文主要针对低分辨率ADC/DAC条件下的Massive MIM
随着军事现代化的推进,红外探测设备被广泛应用于装备夜视、目标侦察以及导弹拦截等领域。对红外图像中的弱小目标进行识别有利于扩大设备作用范围、争取有利的作战时机,红外小目标探测逐渐成为战场上的一项关键技术。然而,目前主流的红外小目标检测算法主要针对的是天空背景,在特殊物体出现的复杂背景下算法的虚警率较高;常见的深度学习目标检测算法主要针对的是自然图像,并不适合直接用于检测红外小目标。本文充分地总结了前
在军事领域中,可使用对弹药破片进行跟踪的手段,来对所研究的大阵列雷达目标跟踪结果的精确性加以验证。但采用实弹爆破往往面临着成本过高的问题,所以需要通过计算机仿真的手段建立仿真模型,并通过仿真模型反应出的运动情况对破片的运动模型进行建立,以此实现对飞散破片目标的跟踪。在破片目标跟踪方面,由于破片目标具有密度大、数量多的特点,使得对其跟踪存在极大的困难,因此,研究面向破片目标的跟踪技术有着重要的现实意
随着遥感卫星分辨率的提高,遥感技术在国土资源利用、城市环境监测和自然灾害预报等领域得到了广泛应用。分割是遥感图像应用的一个重要方面,同时也是遥感图像研究的重点和热点之一。一般来说,遥感图像含有大量特征,包括光谱特征、形状特征和纹理特征等,若只用其中一种特征,通常很难获得高精度的分割结果,因此如何合理地利用多种特征来进行遥感图像的分割以获得更好的分割效果是一个值得研究的问题。本文从特征提取、特征选择
高光谱图像具有丰富的光谱信息和空间信息,广泛应用于军事、农业、地质勘测等领域。虽然高光谱图像含有丰富的可用于分类的信息,但也存在信息冗余以及“同物异谱”现象,在标注样本有限的情况下,分类模型很难获得一个较好的分类结果。随着遥感技术飞速发展,可以很轻易获得高光谱图像,但精确的地物标注需要大量的人工,如何充分利用高光谱图像的空谱信息,在标注样本有限的情况下,提高模型特征表征能力和泛化能力,实现高光谱图