基于注意力机制的用户点击率预测方法研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:colala2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
点击率预测一直是在线广告和产品推荐领域中非常受欢迎的问题,点击率的小幅增长可以带来可观的利润回报。近年来,由于机器学习和人工智能技术在自然语言处理及计算机视觉等众多领域中取得了令人瞩目的成绩,各研究机构和互联网企业纷纷将相关知识应用于点击率预测问题,并为此做了许多研究和探索,取得了诸多出众的成果。本文通过综述近年来点击率预测相关的论文发现:点击率预测的准确性主要受到数据特征规模大、维度高和稀疏性等因素的影响,如何有效地从这些特征中获取有用信息成为问题解决的关键所在。同时,在对用户行为序列特征的利用上还有很大的提升空间,如何从行为序列中挖掘出用户的兴趣,是很多研究人员关注的重点。本文将采用基于注意力机制的点击率预测研究方法,着重探讨特征交互和用户时序行为对于点击率预测的影响。论文主要工作以及成果如下:(1)点击率预测方法和模型综述。对近年来在各个场景中应用较为广泛的点击率预测模型进行归纳分析,并对各个模型的基础模型和结构特点进行分类总结,特别是对具有代表性的模型的框架原理进行了全方面地阐述。并在此基础上,对不同的注意力机制进行了详细地列举。(2)使用注意力网络作为核心优化方向,提出基于因子分解机和注意力网络的多阶特征交互模型MoFM。该模型能够充分挖掘特征的高阶交互信息,同时结合因子分解机来挖掘特征的低阶交互,囊括了传统机器学习和深度学习的优势。通过在三个公开数据集上进行的实验结果证明,该模型在AUC和Logloss两项评估指标下都优于现有的同类型模型。(3)在MoFM模型的基础上,以捕捉用户行为序列为优化方向,提出结合特征交互和行为序列的联合点击率预测框架。Joint CTR框架集成了四种类型的预测模型,每种模型都学习不同类型的特征,包括原始特征、二阶嵌入特征、高阶交互特征和序列特征。Joint CTR框架具有良好的灵活性和可伸缩性,可以根据实际应用需求(例如切割模型或替换相同类型的模型)调整框架中的模块。为了提升高阶特征学习准确率,采用在MoFM模型框架中提出的基于注意力机制的高阶特征学习模型Horder CTR,建立了一个带有残差连接的多头自我注意网络,以自动识别高价值的高阶特征组合。为了对行为序列进行学习,在文中提出序列特征学习模型Seq CTR。该模型基于门控循环单元(GRU)和带有注意更新门的AUGRU,在两者之间添加了注意力层,以获取一系列行为中更重要的时间点。(4)使用四个不同领域的公开数据集来验证所提出的模型框架。实验结果证明,Joint CTR模型在AUC和logloss两项评估指标下都优于现有的同类模型。Joint CTR框架不仅具有更优的性能,同时也具有很强的灵活性和可拓展性,通过组件裁剪和同类模型替换等操作以满足不同的业务需求。
其他文献
随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义
深度神经网络的运算通常都依赖于高性能的显卡,大容量的存储,优良的散热系统等,这些设备的高昂成本严重制约了其进一步发展和推广。同时,性能越优异的网络,其参数量和模型复杂度也越大,而一般的计算设备几乎无法运行。因此,对深度神经网络的压缩与加速成为业界的研究热点,但是对复杂模型进行轻量化设计,通常又会导致模型精度的损失。面对模型的轻量化导致精度下降的问题,本文以深度残差网络Res Net为例,对深度神经
骨龄是一种对骨骼成熟度的解释,通过它可以确定人类的生物学年龄,判断儿童的发育情况。骨龄应用诞生至今已有几十年之久,它不仅在儿科的临床环境中起着重大的作用,其应用已延伸至多个领域。目前,众多专业医师仍采用传统的骨龄评估方式,例如评分法、图谱法等。传统的骨龄评估方式耗时费力,容易受到主观因素的干扰且难以普及。在深度学习兴起之前,为克服人工骨龄评估带来的问题,人们尝试使用传统的图像处理方式来辅助医师进行
甲状腺是人体最大的内分泌腺体,甲状腺结节则是甲状腺内部的肿块,可分为良性和恶性两类。我国的甲状腺结节发病率高居全球前列,属于高发性疾病,患者基数大。超声检查由于其高效且无创的特点成为了筛查诊断甲状腺结节的主要手段。甲状腺超声报告通常描述了甲状腺腺体、局灶性病变和淋巴结的形态及血流特征,这些特征是临床医生进行结节良恶性诊断的主要依据。因此,利用人工智能技术对甲状腺超声特征进行深度学习,建立甲状腺结节
移动互联网的飞速发展和智能终端设备的广泛使用使人们的工作和生活方式逐步被网络化,“远程”和“共享”成为人们社会生活方式的主要组成部分。而且随着计算机科学、通信等传统产业的融合,多媒体正逐步深入人类社会的每一个角落。图像是一种可视化的多媒体信息,是最主要的多媒体形式之一,也是传递信息的重要媒介之一。因此,图像传输的安全性引起了研究者的关注。目前保证图像安全传输的方法有两种:图像加密和信息隐藏。本文主
目前肝脏恶性肿瘤依然是世界上最普遍的癌症之一,它也是人类死亡的主要原因,对人类健康构成了巨大的威胁。为了有效降低癌症死亡率,患者依然需要提前对身体进行全面的检查以及尽早接受治疗。然而由于肝肿瘤与其周围软组织之间的对比度较低,分界不明显,而且对于不同的病人,肝肿瘤的形状,体积,数量和位置等差异明显,同时多种扫描方案导致CT图像存在噪声干扰等问题。由于肝肿瘤分割难度较大,仅仅依赖医生的肉眼检测很难得到
速度快、准确度高的车辆检测系统不仅能够帮助交通指挥员加强对道路交通系统的管理,而且能够在交通事故等紧急事件中快速提取出事故车辆的信息,提高处理紧急事件的效率。可见,提高车辆检测的精度和速度对增强城市道路交通管理系统具有重要意义和应用价值。本文深入研究了Mask R-CNN网络模型,对其主干网络和Ro I Align进行改进,提出了CA-PS Mask R-CNN网络模型,完成以城市道路为实际背景的
随着国家经济实力的腾飞和科学技术的突飞猛进,各行各业对数据重视程度日益提高,大量生产、交易、医疗等数据被收集起来,用于企业产品升级或服务转型等诸多方面研究。面对具有高度复杂、体量大、易变性等特点的海量数据,如何对其进行精准检测和快速分析,从中挖掘出具有的潜在价值,已成为当今数字化时代研究的热点问题。作为大数据领域中的一个重要研究分支,时序数据的异常检测与快速分析技术主要利用整体数据的分布状态,找出
由于当下的中小学生握笔手势不规范,导致写字质量不高、坐姿不良、眼睛近视以及手指关节增生等问题,对其身心健康造成不良影响。针对握笔手势的问题,我国研究者们已经对其进行了较多的理论研究,国家也出台了《关于在中小学加强写字教学的若干意见》等一系列文件,不仅强调了学生使用正确的握笔手势进行书写的重要性,而且明确定义了中小学生正确书写时的握笔手势。然而当前的握笔手势和书法教学主要采用面授和视频教学,缺乏自动
随着互联网的不断普及和服装电子商务的兴起,越来越多的用户通过电商平台购物服装,网上购买服装已经逐渐成了人们的重要消费方式之一,如何在海量的服装商品中高效准确地检索出用户心仪的服装成为了热门的研究方向。目前“以图搜图”技术主要依赖于整张图像特征提取的结果,不能关注到服装的部件,并且服装图像拍摄时背景一般比较复杂,导致服装图像检索准确率低,因此,本文提出一种基于部件检测与分割的服装图像检索方法。本文调