基于用户、商品和上下文特征的推荐系统算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:bluegini2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网蓬勃发展的今天,线上广告、新闻、购物、娱乐等与人们的日常生活息息相关。但是,移动互联网产生海量信息,而人们浏览的信息量有限,如何在复杂多样的信息中挑选目标数据成为挑战。推荐系统通过引导人们购物、新闻浏览、娱乐成为了移动互联网的主流技术,提高推荐系统的精确性对解决人们的挑选困难成为重点关注的话题。为了提高系统点击率(CTR)预估的精确性,需要从庞大的用户历史行为记录中挖掘能指导模型预估点击率的有效信息。为此,论文旨在搭建新模型,来提升点击率的预估精确度。针对推荐系统特征组合问题,充分利用用户、商品和上下文信息,在推荐系统Deep FM模型基础上,提出了改进的点击率预估模型,具体研究工作如下:首先,为了让数据适应模型,纠正或删除不适用于模型的记录,本文对数据进行预处理。数据预处理的方法包括删除唯一属性、解决缺失值、离群值处理、特征编码、数据正则化、选择特征分析主要成分等;为了降低计算成本,将数据变换为更能代表预测模型潜在问题的特征,论文对数据集的数据进行特征工程处理。特征工程处理分两步,一是选择特征、二是特征数字化。对类别变量使用独热编码进行数字化,得到机器学习易于利用的形式。其次,论文对基于因子分解机的CTR预测神经网络(Deep FM)、自适应因子分解网络(AFN)进行研究,创新性地提出了一个融合自适应分解网络的因子分解机神经网络,简称AFN+Deep FM模型。推荐系统数据经常是高维的、多领域的、稀疏的、多类型的、关联却又很少的,而AFN+Deep FM模型中的矩阵分解法能充分挖掘上下文信息进行学习。一方面,Deep FM模型的深度学习模块能从已知的特征中找到有隐藏关系的特征,将它们进行高阶特征交互,以提高模型预估效果。另一方面,AFN模型在前馈神经网络前添加对数转换层,自适应地对输入的特征进行交互输出不同阶的特征组合,前馈神经网络对不同阶的特征组合进行高阶特征交互,AFN模型在不同阶的特征向量组合中挖掘更多的信息,对点击率预估的指导能力变强。因此AFN+Deep FM模型弥补了因子分解机(FM)仅仅能实现一阶、二阶的低阶特征交互的缺陷,挖掘更多的信息,以实现融合模型性能提升。最后,论文对所提出的AFN+Deep FM模型进行了实验验证。模型在Criteo数据集上和Avazu数据集上训练学习,最终AUC值相对其他几个主流模型有所提升,Log Loss值相对其他模型有所下降,证明了AFN+Deep FM模型的有效性。综上,本文提出的AFN+Deep FM模型既进行低阶特征组合、对输入的特征进行高阶特征组合,又对不同阶的特征组合进行高阶交互,充分挖掘信息,提高模型CTR预估准确度。
其他文献
径向磁通式调速型永磁涡流耦合器为一种柔性传动设备,实现了电机端到负载端的转矩传输,同时有着可靠性高、成本低、过载保护、高效节能等优点。永磁涡流耦合器工作时是由导体与永磁体之间相对运动产生交替变换的磁场,导体中产生感应磁场与原磁场相互作用达到传输转矩的目的。本文利用电磁学理论结合有限元仿真和实验对比验证的方法,对永磁涡流耦合器的电磁转矩进行推导以及结构参数对传动特性的影响进行仿真验证,提出一种分段式
学位
随着时代的发展,科技不断地进步,移动机器人已经成为当下社会生产、生活中重要的角色。移动机器人的同时定位与环境地图的创建(SLAM)是当下移动机器人技术研究的热点之一,也是实现移动机器人可以在环境中自主化、智能化移动并完成指定任务的关键技术。对于当下疫情防控使用移动机器人来帮助减轻医护人员的工作强度,降低感染风险的迫切需求,本论文针对医院隔离这种特殊场景改进SLAM算法并搭建了移动机器人实验平台,实
学位
太赫兹(Terahertz,THz)波由于具有带宽大、穿透性强、光子能量低的电磁特性,已成为当前物理学和生物学交叉领域的探究热点。超材料具有超常物理特性,可对太赫兹波的振幅和相位进行调谐,且对周围介电环境变化有灵敏反应。因此,结合太赫兹波谱和超材料传感技术可为物质进行定性、定量的检测提供崭新的途径。柠檬酸盐是由柠檬酸阴离子和金属阳离子结合形成的一类有机盐,由于其特殊的物理和化学性能,常用于食品添加
学位
氮化镓高电子迁移率晶体管(GaN High Electron Mobility Transistor,GaN HEMT)的关键结构是以GaN材料为基础和拥有更高禁带宽度的三元化合物Al GaN形成的异质结。该异质结构因极化效应从而能够在异质结面产生高密度和高迁移率的二维电子气,但是也正因为其高密度二维电子气的存在,导致其在工作时沟道处会积累大量的热,引起器件温度的急剧升高,影响器件的性能。传统的漂
学位
腿足结构给动物带来了极强的运动能力和对地形的适应能力,腿足结构的这些优势使得足式机器人在民用和军事领域具有巨大的应用前景。由于足式机器人是一种多输入多输出非线性的间歇欠驱动系统,所以足式机器人控制非常复杂,实现机器人的平衡与运动难度较大。针对足式机器人自主平衡和平稳运动十分困难的问题,本文在四足机器人步态策略、状态估计、支撑腿控制算法和摆动腿控制算法四个方面进行了设计与优化,实现了一种简洁高效的运
学位
随着工业需求和深度学习的飞速发展,自然场景管线文字识别检测的需求迅速增加.为实现工业上的管线上文本的整理与分类,需要从大量的管线文本上识别相关信息,并于实物进行匹配,减少人员在管理方面所花费的时间.本文开发了一套管线文本的检测与识别系统.以实现能够快速方便的匹配和分类信息处理.本文的主要工作如下:1.针对管线文本数据集缺乏问题,目前并没有特定的自然场景管线文本数据集用来提供训练和检测,因此本文收集
学位
薪酬体系管理是人力资源管理的重要课题,有效的薪酬体系管理,可以为企业挽留人才,并且激发好员工的巨大潜能,反之,则会增加人员流失率,进而降低企业发展所需的人力资源储备,最终阻碍企业的发展。在事业单位改制的背景下,如何使公司有限的工资总额发挥最大的作用,实现薪酬的降本增效,薪酬体系管理发挥着重要的作用。作为本文样本的S公司,是一家拥有700余人的研究所,主要从事电子类研究,随着市场竞争的激烈程度加深,
学位
金属材料目前已广泛应用于桥梁、铁路、风机叶片等大型基础设施中。由于大多数设施暴露于室外环境,不可避免地会产生金属疲劳,导致其承载能力和可靠性下降。结构健康监测则是对该类结构的破坏部位进行检测和监测的技术。为了满足传感器大规模安装、组网灵活以及良好的可拓展性等需求,无线检测得到了快速发展。本文结合科研项目课题,紧跟无损检测技术以及无线传感网络的发展需要,以超表面透射阵列波束调控特性为切入点,对提高无
学位
移动网络技术快速发展,5G因其能提供大带宽、低时延、广连接和高可靠的优质网络服务,而被广泛应用于众多垂直行业。其中,电力物联网(Power Internet of things,PIo T)是最为关键的典型应用之一,5G应用于PIo T场景可匹配典型业务并满足电力多样化需求。网络切片技术是5G在电力应用中的重要赋能技术,它可以把物理网络切分为几个逻辑独立、相互隔离和功能不同的虚拟子网,从而提供差异
学位
从2013年开始,中国的电子商务行业蓬勃发展,截止2020年底,国内网络购物市场的年销售额在社会总销售额的占比达到21.9%,高达10.8万亿元。在人们普遍认知中,综合类第三方电子商务平台是京东和阿里形成主导的寡头垄断局面,综合类电商平台一直未出现能够与两者匹敌的后来竞争者。创立于2015年9月的拼多多却在阿里京东统治的电商红海里异军突起,仅3年取得了令人瞩目的光辉成绩,并完成了在美国上市。尽管拼
学位