面向展示广告的广告主利润优化算法的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lg0768
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网广告脱颖于传统的广告投放,为流量变现提供了一条最便捷的道路。实时竞价(Real-Time Bidding,RTB)广告成为了互联网广告中最主流的在线广告投放模式,也成为了互联网媒体最主要的盈利手段,同时给更多的中小型广告主提供了品牌宣传的机会,用户在享受媒体服务的同时能够发掘感兴趣的消费内容,实现了多方位互利共赢。而这背后的技术研究与实践也被越来越多的研究者所关注。本文的研究内容包括在实时竞价系统中为了优化广告主利润,研究者重点关注的两个方面,一是出价策略优化,二是点击率预测准确性优化,本文使用最大化策略熵的随机策略强化学习算法框架的手段,优化这两方面,从而实现广告主利润的优化。本文的主要成果包括:(1)在出价策略的研究中,本文提出了一种新的调优出价公式,细粒度地针对每条曝光机会进行调优出价,让出价结果不会过于偏离曝光机会的真实价值。通过一个基于最大化策略熵的随机策略强化学习算法进行调优出价,解决由于广告竞价机制带来的单粒度出价存在的学习困难问题。首先通过曝光机会的价值估计做出一个基于价值的基础出价,再通过强化学习模型观察当前竞价环境以及统计信息输出曝光机会的调整因子优化广告竞价,本文采用了SAC(Soft-Actor-Critic)强化学习算法作为调整因子的输出模型,并在真实数据集上实现了该出价策略。(2)点击率预测模型作为价值评估的关键环节,本文提出了通过强化学习作为次学习器的融合模型来维持点击率预测任务的稳定性,使用强化学习算法生成一个融合参数矩阵,融合多个子学习器预测结果来保证点击率预测任务的准确且稳定。同样使用加入了最大熵的强化学习模型来解决不同融合参数矩阵会有相同融合结果的多最优问题,让融合模型能够更好地学习融合参数矩阵的输出,从而维持融合点击率预测模型的准确性与稳定性。并通过在真实点击率预测任务场景下进行实验证明融合模型的可行性与优势性
其他文献
事件抽取是信息抽取中的一个较为复杂的课题。在实际的工业管理软件领域中,事件抽取在处理客户投诉等工作中具有极高的应用价值,能够帮助企业实现产品的快速更新迭代和保持用户粘性。事件抽取不仅是目前自然语言处理的研究热点和难点,也在知识图谱相关任务中发挥着重要作用。事件抽取的任务目标是将非结构化的自然语言文本进行结构化的处理,从中自动抽取用户所需要和关注的事件信息并进行存储。目前BERT为代表的预训练模型能
学位
直接模拟蒙特卡洛方法(Direct Simulation Monte Carlo,DSMC)是目前求解稀薄气体领域真实气体流动问题的一种强有力的工具。非结构网格作为DSMC方法的一个重要分支,在复杂几何外形的计算网格生成方面具有自动化程度高、生成周期短、分布控制灵活等优点,已被DSMC工程计算广泛采用。然而,随着应用的不断扩展,非结构DSMC求解的问题越来越复杂,对计算与存储量的需求日益增加,开展
学位
当今世界正处在一个信息爆炸的时期,从繁杂的信息中检索出需要的信息是困难的,也是必要的。由此,知识发现技术得到飞速发展,以知识图谱为基础的关联知识发现系统,通过利用实体及关系信息,能够挖掘出深层的关联信息。但是,由于网络信息具有噪声混杂、知识稀疏的特点,如何从海量信息中提取出有效信息,并转化为知识图谱中结构化知识,是目前研究的一个热点问题。通过对自然文本进行清理,筛选出缺少的知识,最后利用实体链接技
学位
随着机器学习以及大数据时代的到来,量子编码理论逐渐成为量子通信发展的焦点。针对量子编码,国内外研究学者提出了量子纠错码构造方法,这是量子编码众多方法之一也是其必经之路。在构造量子纠错码过程中,量子纠错码纠缠度和低损耗译码误帧率(FER)是判定量子纠错码是否有效纠错的重要标准。由于量子纠错码受到高维图态不易构造以及量子纠错码纠错也会受到环境中噪声或信道中随机扰动强度等问题的限制,本文从量子纠错码纠缠
学位
随着科技的不断发展,信息化社会的计算数据量急剧地增长;同时根据摩尔定律计算机芯片内部集成度也越来越高,集成芯片受“尺寸效应”和“热耗效应”上限的影响。凭借量子态叠加,纠缠以及测量塌缩的特性,量子计算为未来科学技术的进步提供新的计算思路。数字图像包含诸多信息在互联网上广泛存在,因此近些年图像处理技术快速地发展。量子图像处理技术是结合量子计算方向和经典图像处理方向的新兴领域,其目的是把传统图像处理任务
学位
近年来,随着大规模并行计算技术的进步,基于神经网络的对话系统得到快速发展。但是,当前开放域对话系统依然存在以下问题:对话模型容易生成上下文无关、不合语法甚至自相矛盾的回复。模型未能较好的完成自然语言理解与生成任务。本文的研究主题在于构建一个能生成高质量回复的开放域对话系统,在预训练语言模型的基础上,从语言理解与对话生成角度对原有模型进行改良。本文的主要内容可以归纳如下:1)提出了一种引入真实回复信
学位
近年来,交通仿真技术越来越多地应用在智能交通技术中。随着智能交通技术从理论研究阶段逐步步入实际应用阶段,传统的交通仿真技术逐渐体现出多方面的不足,如真实度不足以反映城市交通的实际情况、难以与其他智能交通技术配合等。基于以上背景,本文研究分析了现有交通仿真技术的特点与不足,设计并实现了一个高真实度的城市交通仿真引擎框架,并对仿真系统中车辆路径规划算法进行了研究,提出了一种基于驾驶员经验预估的车辆路径
学位
随着信息技术的高速发展,信息安全问题受到的关注也越来越多。作为公钥密码学的一个重要分支,属性基加密体制是实现数据加密和细粒度访问控制的一种有效技术手段。然而,现有的大多数属性基加密方案不仅存在着访问结构效率低下、访问策略表达能力有限等一系列问题,而且只具有选择性安全或者只能在非标准的数学困难问题下实现适应性安全。同时,考虑到实际应用中用户撤销或密钥泄漏等问题,属性基加密体制有必要引入有效的撤销机制
学位
确保数据机密性和可用性是现代社会关注的热点问题。公钥密码体制是解决上述问题的有效手段。但标准公钥加密体制会使得云服务器中存储的数据难以检索,并且降低数据的可用性。支持等式测试的公钥加密体制是公钥加密体制的一种特殊形式,允许半可信服务器在不执行解密的前提下对采用相同或不同公钥生成的密文进行相等性测试,较好地解决了高效密文检索问题。然而,目前支持等式测试的公钥加密方案大多基于公钥密码体制构造,存在证书
学位
随着智能汽车数量的不断递增以及智慧交通概念的提出,车联网作为其基础支撑技术已经开始了飞速发展,但在面对与日俱增的的汽车数量和海量的数据不断产生时,传统的车联网交互模式在密钥管理、数据存储、并发性能和响应速度方面都存在不足,中心化的身份认证和数据存储方式易受到恶意攻击导致单点失效、伪造身份、篡改数据、泄露隐私等问题。为此,本文利用区块链去中心化和不可篡改的特性提出了双链结构的汽车链方案,重点采用智能
学位