【摘 要】
:
互联网的蓬勃发展带动了社会的整体变迁,使社会生产力得到快速发展。互联网与传统行业的结合改变了人们的生活方式,已成为人们生活中不可或缺的一部分。对于互联网公司来说,广告变现是公司赖以生存的手段之一。点击率预估是广告变现的重要环节,其效果直接影响广告投放的成功率。行业内对点击率预估问题最为常见的评价指标为AUC(Area Under Curve)。它能直观地反映出广告点击率预估的效果:AUC值越大,说
论文部分内容阅读
互联网的蓬勃发展带动了社会的整体变迁,使社会生产力得到快速发展。互联网与传统行业的结合改变了人们的生活方式,已成为人们生活中不可或缺的一部分。对于互联网公司来说,广告变现是公司赖以生存的手段之一。点击率预估是广告变现的重要环节,其效果直接影响广告投放的成功率。行业内对点击率预估问题最为常见的评价指标为AUC(Area Under Curve)。它能直观地反映出广告点击率预估的效果:AUC值越大,说明广告点击率预估效果越好。因此,如何提升广告点击率预估模型中AUC的值是学术界与工业界普遍关注的问题。本文通过对广告点击率预估模型的研究结果进行总结,发现现有的广告点击率预估模型存在以下问题。第一,现有的深度学习点击率预估模型如DCN(Deep&Cross)、NFM(Neural Factorization Machines)、Deep FM(Deep Factorization Machine)等注重于捕捉特征的交互而忽略了特征本身的重要性。第二,随着深度学习模型网络层的增加,模型的训练难度就会加大,导致模型训练效果不佳,一些模型如NFM、DCN尝试引入归一化方法进行改进,但不够深入。在此背景下,本文通过对前沿深度学习点击率预估模型进行研究,考虑了特征重要性的因素,提出了一种新的基于特征重要性的点击率预估模型,并将归一化方法作用于该模型。本文的主要内容包括以下几方面:(1)对点击率预估模型和归一化方法的相关技术进行研究和分析,并在此基础上对现有的点击率预估模型及ECA模块的相关知识进行详细阐述。(2)针对现有的点击率预估模型忽略了特征交互前特征的重要性问题,本文提出了基于特征重要性的点击率预估模型EPBi NET。该模型由Embedding层、ECANET网络层、Bi-Interaction层、Product层以及DNN网络构成。该模型通过Embedding层将特征转变为低维稠密的嵌入向量,之后利用ECANET网络层动态学习特征的权重,并将得到的权重与原嵌入向量做乘积得到新的带权重的向量。然后通过Bi-Interaction层、Product层以及DNN网络进行特征的交互,捕捉高阶特征。在两组公开数据集上,通过对比实验验证得到的EPBi NET模型效果在AUC指标上优于实验对比模型。(3)针对现存点击率预估模型对于归一化方法的应用研究较少,本文探索了归一化方法应用于点击率预估模型的Embedding层与MLP部分上的效果,并在点击率预估中提出了一种批层归一化(ABLN)。该方法结合了批归一化(Batch Normalization,BN)与层归一化(Layer Normalization,LN)两种方法的特性,通过自适应的方式自动选取合适的归一化方法。本文通过大量的实验对比,发现归一化方法应用于点击率预估模型的Embedding层与MLP部分都可以提升原有模型的效果,且ABLN方法作用于模型的Embedding层与LN方法作用于MLP部分的方式能够大幅度地提高点击率预估模型的AUC。
其他文献
可视化力敏传感器是一种能够将外力信息转化为视觉监测信号的传感器件,与传统电子压力传感器相比,具有元件组成简单、易于监测等特点。目前,可视化力敏传感器大多基于摩擦发光材料、光子晶体材料等制备得到,但都无法同时实现力的可视化记忆及器件的重复利用。胆甾相液晶能够产生高亮度、高对比度的结构色,而利用聚合物网络锚定胆甾相液晶制备的聚合物分散胆甾相液晶(PDCLC)具有双稳态和压力、电刺激响应特性。其能够在压
全球智能化进程的加快让自动化机器人产品逐步走入餐饮服务行业甚至是家庭,以扫地机器人为例的智能产品有效解决了人们追求精致生活与“懒人”本性的矛盾。疫情期间对厨房智能产品的需求攀升暴露出了家庭场景智能化的不足与潜力,相关研究表明,厨房作为家居环境中的重要组成部分拥有极大的优化空间。机械臂的技术发展为“释放双手”提供了新的可能性,而冰箱作为厨房烹饪及日常流程中的重要环节,解决如何从中抓取物品是保障作业流
在纺织工业中,经常会出现纱线断纱或续纱的情况。因此,纱线打结问题是不可避免的。空气捻接法、机械打结法是目前最常用的打结方法,但是大部分情况下只适用于一种纱线,并且机械结构十分复杂。针对上述问题,本文提出了一种基于磁悬浮的纱线打结方法,利用安装了纱线夹的悬浮体牵引单向无限延伸的纱线在空间中运行绕环、穿插等成结轨迹,实现多种类型纱线的打结,并尽可能地简化机械结构。该方法的提出对于纱线接头技术的创新性研
随着计算机技术的发展,笔记本电脑的功能愈发强大,组成结构也愈发繁琐,这就对其稳定性测试带来了一定的挑战。BIOS(Basic Input Output System)作为计算机最底层的一环,是直接沟通协调各主要硬件设备的控制者,传统手工测试BIOS的方法已逐渐无法满足当前对笔记本电脑稳定性的测试需求,而利用自动化测试手段能实现高效可靠的测试流程。由于BIOS中无法直接运行现有的自动化测试工具,因此
近年来,互联网的飞速发展导致网络信息量的指数级增长,在浩瀚的信息流中搜寻信息一直是让用户头疼的问题,直到智能推荐系统的出现才得以大幅缓解,它在解决用户搜寻信息难问题的同时也给企业自身带来了巨大的利益回报。在这样的时代背景下,电影领域的推荐系统也随之而来。因为深度学习强大的特征学习能力,在当今电影推荐系统的推荐算法中已经成为了主流,其中通过深度学习提取用户行为序列信息进行推荐是当今许多研究人员关注的
互联网的急速发展深刻的影响着人们的日常学习、工作和生活,尤其是移动互联网的发展与普及,大大增加了互联网数据流量的消耗。网络世界繁荣发展的背后,也有着不可轻视和忽略的威胁与风险,例如网络攻击、隐私泄露等。因此能够提前利用入侵检测系统对风险行为进行预警就显得尤为重要。传统入侵检测方法(如专家系统)难以有效的检测新型网络攻击,入侵检测领域迫切需要更加智能的技术来处理当前面临的难题。机器学习算法将网络攻击
喷气涡流纺自1997年面世以来,就以毛羽少、纺纱速度快等显著特点得到迅速发展,并广泛应用于多种纺纱场合,其中之一就是包芯纱的纺制。目前与喷气涡流纺包芯纱相关的研究大部分都集中在纱线质量提升和对应的纺纱参数优化,对于包芯纱的成型装置关注较少。如包芯纱的芯丝穿引与废纤清洁均采用手工操作,效率低下。因此对喷气涡流纺装置的研究具有现实意义。本文针对喷气涡流纺纱机的结构特点研究设计出一种芯丝穿引系统,适应于
静电纺丝技术作为制备纳米纤维最简单快捷的方法,它所制备的纳米纤维膜有着孔隙率高、比表面积大等特点,因此在废水过滤材料、医用防护材料、传感器等生产领域得到广泛应用。但长久以来,纳米纤维膜的制备过程由人工督察,因为喷射流的不稳定及无规则喷射导致经过长时间的连续纺丝易出现纺丝不稳定或堵塞等异常情况,而人工无法通过肉眼察觉,并且实验试剂通常带有毒性与挥发性,对人体健康有一定的危害。若基于机器视觉采用相机监
随着我国经济的发展,越来越多的国际贸易、货物运输依赖于集装箱。集装箱减少了货物运输的成本,从而推动世界经济的发展,但其广泛应用导致港口的吞吐量增速加快,容易造成各大港口拥堵,杂乱不堪,给港口的管理造成巨大的压力。为了对集装箱实行更好的管控,集装箱编号识别系统应运而生。传统集装箱编号识别技术容易受到复杂环境包括光照、字符倾斜、扭曲、破损等影响。近年来,由于深度学习具有快速准确的优点而成为模式识别重要
随着工业自动化技术的进步,具有高效率、高安全性、高柔性的工业机器人在制造业中的应用正变得越来越广泛,能够提高机器人工程开发效率、降低开发成本的机器人仿真系统也成为了研究的热点方向。本文从机器人仿真系统与PLC控制器信号交互的角度出发,开发出一款集成了机器人三维仿真、通信、传感器模拟、机器人程序解析、运动轨迹规划等功能的工业机器人跨平台仿真系统。本文的主要研究内容如下:以工业机器人跨平台仿真系统为研