基于特征交互的点击率预估算法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:RaymanL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习和大数据技术飞速发展,越来越多的互联网公司开始重视如何提升广告点击率的预测精度.点击率预测的精度越高,推荐给用户的信息就越准确,广告主获得的收益也就越高.为提升点击率预测的精度,人们往往通过手动组合的方法进行特征交互.但这种方法成本高、效率低,所带来的精度提升也不高,所以如何准确、高效地挖掘样本信息中隐式的交互特征,从而提升预测精度,成为了点击率预估算法的重要任务.针对该问题,本文对前沿预测算法中建模交互特征的机制进行了一系列的分析与研究.具体的工作有以下两个方面:(1)对点击率预估中前沿算法的特征交互机制进行了研究.首先,针对目前公开数据集存在交互规则不明确和信息上限未知的问题,建立了只有低阶、高阶交互特征规则的实验数据集,其次在这些数据集上测试了前沿的点击率预估算法,包括GBDT、深度神经网络等,并重点从性能、原理和可解释性三个方面对实验结果进行了分析说明.实验最后表明大部分算法难以求得特征交互的最优解,尤其是GBDT等决策树模型,决策树模型虽然非常擅长对相关关系进行建模,但抗噪能力较差,不适用于挖掘交互特征.另外,使用深度学习算法可以显著提升点击率预估的精度.(2)针对目前预测算法中特征交互表达能力不足的问题,提出了一种融合特征交互与选择的模型XgbAFM.该模型的核心思想是使用XGBoost进行自动化特征工程,并按特征重要性筛选一定比例的特征进入深度神经网络;同时,为对原始数据进行更深入和更充分的特征交互,将Embedding后的类别型特征分别输入到了 FM模型和DNN模型中,然后使用注意力网络动态地学习交互特征的重要性,从而兼顾了低阶和高阶的特征表示.在Criteo数据集上的实验表明,XgbAFM模型有效提高了广告点击率的预测精度,其AUC相较于最优的基准模型,提高了 1.6013%.
其他文献
习近平主席在2021年两会上指出,“十四五”期间,预计中国将进入中度老龄化阶段,因此将积极应对人口老龄化上升为国家战略.在第七次全国人口普查背景下,普查数据显示我国人口老龄化进程明显加快,预测2030年前后将迎来老龄化高峰期.人口老龄化会引导最终消费的规模和消费结构发生变化,并且导致最终消费表现出老年人的消费习惯、偏好和消费能力,人口老龄化也将直接导致国内市场需求的转型,老龄化会带来经济发展的机遇
学位
随着教育事业的发展与改革,人们对初中英语教师素质提出更高的要求。教育科研是促使教师保持终身学习行为,促进教师专业发展,并提高教师教学质量的重要途径。教育科学研究也是教育事业的重要组成部分,对教育改革发展具有重要的支撑、驱动和引领作用,国家鼓励支持中小学教师积极参与教育教学研究活动。初中英语教师是中小学教师中的一个重要群体,探索初中英语教师科研对其教学的促进作用,对于促进教育科研发展,加快建设高素质
学位
在生活基本物质需求得到满足的前提下,大众对于精神生活的需求越发强烈,看电影、KTV唱歌等传统文娱方式早已使人们产生审美疲劳,而真人密室逃脱的新颖性可以满足人们在精神层面追求刺激的需求.密室逃脱行业在2021年的市场规模已达到101.2亿,消费人次达到280万人次,门店个数超过10000家,在娱乐活动中占据着不可忽视的地位,丰富了大众的娱乐生活.如今互联网发展迅速,有很大一部分消费者均在线上购买门票
学位
中国近几十年的粗放型经济增长方式,虽然使得中国经济有了突飞猛进式的发展,使中国成为了世界第二大经济体,但粗放型经济增长方式也严重破坏了环境,产生了非常棘手的环境问题.进入新时代,人们逐渐开始重视环境污染问题,“绿水青山就是金山银山”的观念日益深入人心.绿色金融改革是人们寻求“绿水青山”与“金山银山”协同发展的新尝试.2017年6月14日召开的国务院常务会议决定在浙江、江西、广东、贵州、新疆五省(区
学位
产业结构可以展示现阶段我国经济发展情况,是经济研究领域的重要指标.习总书记指出:推动经济高质量发展,要把重点放在推动产业结构转型升级上.产业结构优化升级为经济持续稳定发展提供内在动力,是实现经济高质量发展目标的关键环节.创新能力的提升可以带来技术的变革,是产业结构优化升级的必要因素.因此,本文探究创新能力对区域产业结构优化升级的影响效果和影响机制,并提出合理有效的政策建议,以期能提高区域创新能力,
学位
教育测评即教育测量与评价,是现代教育科学研究的三大领域之一.从狭义上讲,它是教育者通过一定手段、方法和工具,测量和评估受教育者的能力、综合素养和个性的过程.传统教学考试是基于经典测量理论的教育测评,由于有测量误差的存在,被试者的真实能力水平值不等于所测值,越来越不能适应教育测评的需求,基于项目反应理论的自适应计算机考试系统(Computerized Adaptive Testing,CAT)应运而
学位
心脏病是一类常见的高发性疾病,我国每年都有数十万人死于心脏病并且发病人数有逐年攀升的趋势.科学地研究心脏病影响因素并建立心脏病预测模型意义非凡.使用机器学习的方法对心脏病风险评估,既可以提高医生的诊断效率和准确性,又能对心脏病的预防和治疗起到积极的作用.现有文献基于机器学习对心脏病发病预测的准确率大都较低,本文针对心脏病患者临床记录的相关数据,使用多种算法建立多个统计模型,通过对比模型的拟合效果,
学位
生物测序技术发展迅速,越来越多的癌症数据信息被挖掘,基因分析方法的多样化也使得了解疾病背后的致病机理与关键突变基因成为可能,为后续开展化疗及靶向治疗等提供理论基础.基因治疗作为新兴治疗手段,可以将靶向药物精准输送至突变基因,有针对性地开展预后治疗.恶性胸膜间皮瘤隐匿性强,患者生存期短.已有研究结果显示,间皮素和纤毛蛋白-3可用于筛选生物标志物,SUV值可判定预后效果.目前双免疫治疗法将患者生存时间
学位
我国经济高速发展,人们的生活水平不断提升,饮食观念也完成从“吃得饱”到“吃得好”再到“吃得健康”的蜕变.随着人们生活质量的提高以及服务型体育消费占比的增加,消费者对健身服务质量的要求也日益提升,健身休闲食品作为低热量、低脂肪的代表得到人们的青睐.但是目前我国健身休闲食品行业存在总体数量庞大但单个企业规模小的问题,行业门槛低,市场产品和渠道同质化严重.在健身休闲食品销量高速增长的背后,存在很多影响消
学位
大量相关研究证明了学习动机对外语学习的重要性。随着信息技术化的发展,“智慧课堂”越来越多地出现在中小学外语教学中。关于“智慧课堂”对学生学习动机影响,特别是针对小学生英语学习者,目前的研究不多,因此有必要对该领域进行研究。基于此,本研究以小学六年级学生为研究对象,探究“智慧课堂”对六年级学生学习动机的影响,具体回答以下3个研究问题:(1)“智慧课堂”对六年级学生的英语学习动机和学习成绩是否产生影响
学位