基于注意力机制和图神经网络的广告点击率预估算法模型研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lhchg1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
点击率(Click Through Rate,CTR)预测是一种根据日志数据对用户属性和行为建模的方法,该方法使用机器学习算法预测用户在特定的场景中点击某一广告概率。本文将研究并改进特征表示和特征交互对点击率模型预测效果的影响,从而提升服务质量。目前大多数CTR模型遵循如下的建模方式:将嵌入向量进行简单拼接后输入到因子分解机和深度神经网络中进行特征组合,并将这些组合特征输入到softmax函数中,经归一化运算可得到广告被点击的概率。该方式存在以下两个问题:1.缺少对特征差异性进行建模的过程。2.大多数模型将所有特征映射到同一嵌入空间内,使模型无法区分多域分类特征中不同字段特征的语义差别。针对问题1本文提出了一种基于双重特征重要性的浅层模型DA-FM,对特征差异性进行建模。一方面,使用ECANET动态计算输入特征在全局信息下的权重,对输入特征重新加权表示,以区别有效输入特征和无效输入特征。另一方面,使用Atention-Net计算特征组合的强度,识别出有意义的特征组合。从输入特征和特征组合两个方面计算特征的重要性权重,获得多元化的二阶特征,提高模型的可解释性和记忆性。针对问题2本文提出了一种基于异质图的图神经网络深层模型Fi-HGNN。采用异质图表示不同字段特征的语义性差异并进行建模,得到特征在不同语义空间下的向量表示。通过聚合和更新相邻图节点序列状态信息实现特征交互,构建注意力边权矩阵衡量特征节点间结合的强度,从而提高模型的表征能力和预测准确率。本文将DA-FM和Fi-HGNN模型在公开数据集Criteo和Avazu上进行对比实验和消融实验。实验结果表明,本文提出的DA-FM模型和Fi-HGNN模型在上述数据集中,与同类模型相比均能取得更高的AUC值,即CTR预测结果更为准确。同时,通过消融实验验证了各个模块的效果,证明结合两种不同的方式关注特征的重要性有利于提高模型预测能力。此外,实验证明了使用异质图神经网络能够提高模型的表征能力和特征交互能力,从而提高模型的预测准确率。
其他文献
市政工程主要包括道路、桥梁等与居民生活相关的工程建设。由于使用人数众多,市政工程不单单是使用质量那么简单,更关系到城镇正常生活及秩序的平稳。因此,强化市政工程建设,优化施工质量,对于推动市政工程有着重要的价值意义。
期刊
近年来,区块链已经和人工智能、大数据、物联网等前沿信息技术深度融合。其中,区块链下的物联网相关研究,如隐私保护、能源和数据交易、物联网下的共识机制等正在如火如荼地开展。然而,基于区块链的物联网面临一些严峻的挑战,这些挑战源于解决共识机制中的工作量证明问题(Proof-of-Work,Po W)需要大量的计算资源,但是物联网设备的计算资源有限,这限制了更复杂研究的开展。为了解决这个问题,可以将边缘云
学位
近年来,目标跟踪领域的新技术不断出现。其中,动态目标跟踪是移动机器人领域的研究热点,从公共场所的治安监控、道路中对违章车辆的监控、自动驾驶车辆再到无人机对目标的跟踪,目标跟踪技术已经广泛应用于各个领域。然而,目前的动态目标跟踪技术依然存在一些关键问题。首先,用于监控领域的目标跟踪基本都通过固定形式的摄像机拍摄视频,即使能够在支架上旋转,单个摄像机能够观察的视野非常有限。其次,应用于机器人领域的动态
学位
在实际控制系统中,因为被控对象本身或所处环境的物理局限性,往往会约束控制系统的输出或状态。与此同时,控制系统的性能是考察控制器是否有效的关键评判因素。所以,研究面向性能的非线性系统约束控制问题具有重要的意义和价值,并且取得了一定的研究成果,但依然存在未解决的难题,即:现有基于障碍李雅普诺夫函数的控制方法通过约束跟踪误差来实现对系统输出的约束,要求系统输出初始值必须限制在一个比给定约束区间更小的区域
学位
肿瘤药物敏感性预测在指导患者临床用药方面具有重要意义。本文基于癌症药物敏感性基因组学数据库(genomics of drug sensitivity in cancer, GDSC) 198种药物的细胞系敏感性IC50数据,通过Stacking集成学习构建了包含基因表达、基因突变、拷贝数变异数据的多组学癌症药物敏感性预测模型。采用多种特征选择方法对基因特征进行降维,使用Stacking方法集成6种
期刊
在机器学习领域,多视角聚类是一个热门的研究方向,其主要的任务是根据多视角数据自身的数据特性,对不同视角的数据进行融合,获取数据的潜在模式,从而将数据划分为不同簇类。目前,针对多视角聚类的研究,研究者们提出了许多方法。其中,比较受关注的是基于表示学习的多视角聚类方法。该类方法的核心思想是在子空间中,从多个视角数据中学习一个统一的表示,用于聚类。因此,基于表示学习的多视角聚类方法的关键在于如何从多视角
学位
随着现代智能制造技术的快速发展,控制系统对象变得越来越复杂。首先,在控制系统中,大部分控制对象并不能简单用传统的线性数学模型表示,受控系统往往是非线性系统,由于实际工业系统中存在未知不确定对象和外界扰动,而难于建立精确的数学模型,因此受控对象是不确定系统。其次,由于信息化与网络化的布局在加快,相对于传统控制系统,网络化控制系统已经成为控制系统的重要研究方向。现在,在闭环控制系统中,很多工业设备之间
学位
计算光刻技术作为超大规模集成电路(Very Large Scale Integration,VLSI)制造的核心技术之一,在集成电路制造的一系列模拟过程中发挥着重要的作用.掩模的近场计算在极紫外(Extreme Ultra-violet,EUV)光刻技术的模拟中,是作为工艺建模和仿真验证的基本任务之一.因此,掩模近场的计算在计算光刻的仿真与模拟中是必不可少且非常关键的部分.然而,随着摩尔定律的延续
学位
围绕工业绿色低碳发展,回顾中国电子技术标准化研究院在支撑政府、服务产业方面的探索和实践,包括支撑标准体系建设、开展重点标准制修订、健全市场服务能力、打造绿色低碳系统集成解决方案供应商和工业绿色低碳领域专业研究机构,并展望未来,致力加快构建成为国内一流的绿色低碳标准化科研与服务机构。
期刊
多旋翼飞行器由于具有体积小、机动性好和悬停能力强的特点,是执行室内外多场景作业的理想平台。随着近年来飞行器技术的快速发展,多旋翼飞行器已经广泛应用于各种场景当中。对于多旋翼飞行器,其关键技术是飞控系统中的状态估计以及运动控制。本文针对恶劣环境下多旋翼飞行器状态估计的安全性要求,提出了以下两个关键技术问题:1)如何校准低成本传感器的误差参数从而获得精确可靠的测量值;2)如何融合多源信息以提高飞行器状
学位