基于用户行为序列的神经网络与集成学习推荐算法

来源 :兰州大学 | 被引量 : 0次 | 上传用户:rkn7621278
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统早已被部署在了网络生活的各个领域中.在正常的交互场景下,用户实时产生的使用数据是非常稀疏的.传统的推荐算法由于模型搭建不够灵活,没有更深层的挖掘出用户的个人偏好与其过去浏览过的物品之间的关系.本文为了充分捕获用户与物品之间的潜在关联,采用经典的Word2vec方法挖掘用户行为序列中的信息.不仅应用在了代表用户喜好的物品序列中,并且创新的将其应用在了代表物品受众的用户序列中,由此获得初级的、稠密的用户以及物品向量.再结合更多与这两项有关的属性特征,分别采用MLP、XGBoost两种机器学习算法,抽取不同特征间更深层次的非线性关系.基于此,本文搭建了四种不同的算法模型:基于物品序列的神经网络模型(IB-MLP),基于用户序列的神经网络模型(UB-MLP),基于物品序列的XGBoost模型(IB-XGB),基于用户序列的XGBoost模型(UB-XGB).在三种推荐领域常用的公开数据中对比这几种算法和另外三种经典模型的预测结果.最终结果显示IB-XGB方法同时拥有更高的准确率和更好的鲁棒性.
其他文献
由于受到各种致缺因素的影响,缺失数据问题在当前各个学科领域已经成为了一个普遍现象。缺失数据的存在不仅会使数据集失去很多有价值的信息,而且会增加统计分析工作的复杂度和降低数据挖掘工作的效率,导致分析结果和决策存在一定的偏差。由于不完整数据集给数据分析和挖掘工作带来了极大的困难和阻碍,所以缺失数据处理方法的探索和研究对数据分析工作具有重要意义。本文从数据样本的特点出发,通过对灰狼优化算法(GWO)、粒
学位
近年来,U-NET、GAN、VGG16等深度神经网络在图像分割认知方面取得了成功。如何降低深度学习神经网络的训练成本成为了科研人员所关注的一个研究方向。现场可编程门阵列(Field Programmable Gate Array,FPGA)具有可并行执行操作的特性,同时FPGA拥有丰富的逻辑资源和可灵活编程的特点,使得FPGA可以同时进行多次卷积运算。反卷积操作作为最先进的神经网络中的关键组件来训
学位
伴随着生活质量的进步,大气净化和环境保护问题愈发引起人们的关注与思考,环境为何变差以及如何对其进行有效治理成了我们亟需探究的问题.在环境污染防治中,雾霾问题极其突出,且PM2.5是雾霾的主要成分.因此,PM2.5质量浓度的分析与预测对治理雾霾至关重要.本文选取了北京市、苏州市、重庆市和兰州市这四个城市2020年1月1日至2020年12月31日,共366天的空气质量数据.通过特征分析、模型选择和实证
学位
<正>近年来,全球无人作战装备市场持续增长,无人作战领域成为各国加强军事战略博弈的焦点。美国《21世纪战略技术》报告提出:“20世纪的核心武器是坦克,21世纪的核心武器是无人系统。”在近几十年的局部冲突中,无人作战系统从小试牛刀到锋芒毕露,每一次登场都表现惊艳。作为世界无人作战领域的领航者,美军着眼全球军事战略,从战略规划、概念设计、体系建设、技术突破、实战运用等方面深研细耕、协同发力,
期刊
癌症的发病率正逐年上升,目前已成为人类在世界范围内的第二大疾病,仅次于心血管疾病。化疗(化学治疗)是癌症治疗的主要方式之一。然而,传统的化疗方式往往伴随着较大的毒副作用,并在一定程度上抑制宿主免疫系统,从而使得治疗效果有限。近年来,基于纳米材料的新型癌症治疗方法成为生物医学领域的研究热点。本文针对目前化疗所存在的缺点,设计了两种杂化纳米药物,用于乳腺癌的增强化疗及靶向光热化疗研究:(1)氧化铁纳米
学位
长久以来,学者们不断提出时间序列数据的预测研究方法,为决策者提供决策支持.如今,其研究方法不再拘泥于传统的时间序列模型,尤其是对于非线性、非平稳的时序数据,研究方法更是层出不穷.一方面,机器学习、深度学习等技术在数据处理和分析方面具有独特优势,尤其是循环神经网络,它对于非线性特征的学习优势为时序数据的研究提供了新的思路.另一方面,较之单一模型,基于”分解-集成”的方法也可以实现更精准的预测.但是,
学位
超声成像技术由于其便捷性,无创性和无电离辐射等多种优点在医学影像诊断领域中受到广大的欢迎,为医生通过医学临床检查,初步掌握病人病情和病灶,提供了极大的帮助。然而,由于超声成像原理的特性和超声探头仪器的限制,得到的超声图像往往会含有大量伪影和散斑噪声,导致超声成像中组织结构和纹理细节遭到破坏,这些不良特性都影响了医生对病情的诊断,严重的甚至增加了误诊的概率。因此,对超声图像进行合适的去噪处理是十分必
学位
数字经济背景下,社区团购作为零售业的新形式受到消费者广泛欢迎,加之新冠疫情的爆发,使得社区团购进一步发展。传统的消费模式由于社区团购的出现发生了改变。在消费者的需求刺激和不同资本之间的投资下,使得团购市场的竞争日益激烈,且社区团购的发展十分不稳定,社区团购未来将如何发展仍是一个问题。面对众多风险的市场环境和竞争压力,消费者对社区团购平台满意程度十分重要。本文参考国内对社区团购的研究,调查消费者对社
学位
准确的碳排放预测可以为政府制定减排政策提供参考依据,在减缓全球变暖方面发挥着举足轻重的作用。本文首创性的应用了基于核方法的多元非线性灰色模型(KGM(1,N))来预测CO2排放量,但KGM(1,N)的不确定参数可能影响预测精度,很难保证建立的模型为适用全国及区域碳排放数据的最优模型,因此本文利用粒子群算法(PSO)优良的寻优能力对模型参数进行优化,以提高其预测性能和模型适用性。碳排放量数据受多因素
学位
图像分割一直是计算机视觉任务的一个重要部分,也是实现机器智能化和理解化的一个前提,在人脸识别,智能驾驶,医学影像等领域有着重要的意义。近年来随着深度神经网络发展,医学图像分割也取得了重大的进展。但是,深度神经网络的训练通常需要大量的数据和标注,由于医学数据的标注需要大量的临床专业知识和时间以及对于患者隐私问题的保护等原因,就导致数据与标注的代价昂贵且难以获取。目前很多方法对问题的解决都是基于有大量
学位