【摘 要】
:
作为推荐系统、在线广告等领域的核心研究方向,点击率预测受到了学术界和工业界的广泛关注。近年来,随着深度学习技术的火热,许多的互联网公司和相关研究机构在将深度学习和传统点击率预测模型相结合的方向上做出了一系列的优秀研究成果。本文通过对已有的点击率预测模型进行总结和分析,发现大多数模型在交叉特征提取机制上存在着缺陷与不足,尤其是没有考虑到特征之间相关性信息和重要性权重的挖掘。针对上述问题,本文根据点击
论文部分内容阅读
作为推荐系统、在线广告等领域的核心研究方向,点击率预测受到了学术界和工业界的广泛关注。近年来,随着深度学习技术的火热,许多的互联网公司和相关研究机构在将深度学习和传统点击率预测模型相结合的方向上做出了一系列的优秀研究成果。本文通过对已有的点击率预测模型进行总结和分析,发现大多数模型在交叉特征提取机制上存在着缺陷与不足,尤其是没有考虑到特征之间相关性信息和重要性权重的挖掘。针对上述问题,本文根据点击率预测的数据特点,在自然语言处理领域广泛应用的自注意力机制、层次注意力机制等基础上,创新性地提出了一种可以高效挖掘特征之间相关性的多态注意力机制。而后结合推荐系统、自然语言处理等领域的模型结构,本文基于多态注意力机制提出了可以显式构造交叉特征的多态注意力网络。同时基于推荐系统领域的宽度和深度联合学习模型的设计思路,巧妙地结合多态注意力机制和自注意力机制的优点,本文又提出了一种多态自注意力网络模型。并且在此基础上引入深度神经网络分别构建了两种深度点击率预测模型。本文提出的模型经过在多种数据集上进行对比实验验证,在模型性能、计算开销、可解释性等方面具有一定的优越性。实验结果表明,本文提出的点击率预测模型在性能表现上相较于其他对照模型均有明显的领先;在计算开销方面,本文提出的模型在实现较好性能表现的情况下参数量更少,运行速度更快,整体计算效率相较于对照模型有很大的提升;并且本文模型可解释性更好,适合实际的生产环境。
其他文献
近些年移动互联网越来越普及,移动设备进行检索的需求也越来越高。分析并计算检索的性能是评测检索的一个重要指标,同时也是进一步优化用户检索体验的一个重要依据。如何分析和计算检索性能,感知用户检索满意度这个问题,在PC领域上的研究非常活跃,但是在移动领域上很少对移动设备进行针对性的探讨,显然PC和移动设备(如智能手机)之间有非常大的差异。除此之外,在移动检索的不同领域其用户的搜索行为,特别是交互行为跟移
在新一代信息技术的推动下,国内外制造企业积极探索新的生产模式和资源整合机制,尝试实现生产过程的数字化管理。工装是辅助生产制造的重要资源,其制造与管理状况影响企业产品质量与生产效率,但也是企业信息化建设中容易忽略的环节。将工业互联网技术应用到企业工装管理中,可以提高数据的共享与交互能力,支持多任务、多用户的协同工作,对提升制造企业管理水平和工作效率有重要意义。论文依托某汽车空调离合器企业的信息化项目
随着4G网络的快速普及带来了移动互联网的高速发展,导致手机应用的业务需求越来越多,产品的迭代频率也越来越高。如何在产品快速迭代的情况下有效保障业务开发从需求管理到功能按时按质按量的交付上线显得极为重要。有效的全流程管理有助于缩短基于敏捷开发模式的交互周期,提高研发效能和研发质量。本文主要结合国内某互联网公司内部部分项目组对研发流程管理方式进行分析和设计,打造一个公司内各团队适用的全流程研发管理平台
在早期的企业信息化建设中,PC是企业日常办公的首选工具。随着云计算的快速发展,云办公类产品逐渐走进企业。尤其是在今年年初,一场突如其来的新冠疫情席卷全球各个国家,云办公类产品加速成为企业实现在线居家办公的首选方式。目前,主流的云办公类产品主要包括云电脑、云盘、远程连接工具、各类SaaS应用等,然而这些产品都或多或少地存在着问题:(1)云电脑虽然可以替代传统PC,但它仍然是一台虚拟PC。对于普通办公
随着互联网渗透到各行各业,每天都有TB级别的文本信息在互联网上发布、传播。海量文本数据为机器学习提供了丰富的训练资源,促进了自然语言处理领域的蓬勃发展。属性级情感分析是一种自动从原始文本中抽取出实体在不同属性方面的情感信息的技术。属性级情感分析技术具有广泛的应用前景。例如,从产品评论自动抽取出消费者对产品不同方面的评价,从微博推文中自动梳理出大众对热点事件方方面面的观点,从论坛、博客海量文章中自动
随着互联网的发展,网络游戏已成为人们日常娱乐的重要来源。游戏商城中物品成千上万,玩家很难快速找到适合自己的物品,因此个性化推荐系统已是网游中不可或缺的一部分。在解决特征矩阵稀疏问题时,相比SVD矩阵降维算法,混合协同过滤算法可有效避免核心数据丢失,但此算法需要大量的运算时间,个性化推荐延时较重,严重影响用户体验。本文通过分布式技术减少混合协同过滤算法的运算时间,详细分析了目前主流分布式算法出现的问
病理诊断作为癌症诊断的重要手段,人们对其需求越来越大。但我国专业病理医师数量少,常常造成疾病诊断的延误。远程病理诊断是有效的解决方法,而远程病理诊断的实施依赖于数字切片扫描系统。数字切片扫描系统结合光学与自动化技术,将病理玻片转换为高分辨率全切片数字图像。但现有数字切片扫描系统性价比不高、扫描时间长、系统采集的数字切片图像不清晰、最终的全景数字切片图像信息丢失的情况时有发生。因此有必要对数字切片扫
数字PCR是近些年来快速发展起来的一种新的核酸定量分析技术。数字PCR反应结果以荧光点图像的形式加以呈现。但是,由于环境、仪器、样本等诸多因素的影响,系统中会存在一些荧光干扰,叠加在荧光图像上,增加后期图像处理和分析的难度,影响结果的准确性。其中主要干扰来自系统中非样本发射的荧光,如背景荧光等。样本荧光点图像的准确分析是数字PCR结果处理的基础和前提。使用光谱分离技术能够从数字PCR荧光图像中分离
我国老年群体规模越来越大,然而在整个旅游市场中所占的份额却不高。本文结合智慧养老的时代背景,提出一种老年人旅游个性化推荐方案,以充实老年人的退休生活,蓬勃老年群体旅游市场。随着互联网和移动终端的普及,越来越多的老年人开始接触网络信息。本文通过隐式评分策略,使用协同过滤推荐算法,融合老年人生理特征、心理特征以及社交属性,将老年人年龄、性别、运动能力、兴趣偏好及朋友圈信息用作相似度计算,然后根据历史数
随着科技的进步和社会的发展,各种各样的网络不断地交织与迭代,从互联网到万维网,从电力网到交通网,从科研合作网到全球政治经济网,这些网络不仅结构复杂,而且形态各异。在现今互联网时代,对复杂网络的研究既能创造出经济价值,也有利于构建稳定的社会秩序。节点重要性关乎其在整个网络上的影响力,抓住了关键节点就如同把握住了问题的关键与核心。总体看来,当前对网络节点重要性的研究主要集中在对其定量的静态刻画上,而在