基于多类别特征的在线广告点击率预测研究

被引量 : 6次 | 上传用户:hnzxjl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线广告点击率对搜索引擎服务提供商和广告商都是一个重要的量化指标。因此,在线广告点击率预测,是计算广告领域的关键问题之一。工业界与学术界都对点击率预测问题有持续的研究,各个搜索引擎服务提供商都建立了自身的点击率预测体系,可见本课题具有很强的理论研究价值和实际应用价值。本文围绕点击率预测问题,进行了完整的研究方法建模。首先对搜索引擎在线广告进行特性研究,总结出五大特性;在此基础上,定义广告显式特征和隐式特征,进行相应特征提取;并将概率关系模型引入特征选择阶段,将特征分为与真实结果直接相关、间接相关、完全无关三类;然后引入因子分解机模型作为预测模型对广告点击率进行预测,输入端为进行特征选择后的实值特征向量;最后采用曲线下面积(AUC)对预测结果进行评价。值得重点提出的是,在当前研究中,对于特征提取主要强调位置以及广告属性特征,缺乏考虑广告被触发的场景以及广告与用户检索词的联系;已有的基于广告类别特征提取预测广告点击率采用同一类别的广告点击率平均值直接对待预测广告进行预测,无法将广告类别与其他特征混合加强进行预测;对广告直接进行聚类也可以得到广告类别,但是这样只能得到广告的唯一类别标注(本文定义其为广告类别特征)。在线广告本身具有多主题性,单一类别标注在不同的用户检索行为下失去意义。由此,本文提出一种基于广告多类别特征的点击率预测方法:定义用户检索行为对广告的触发作用,通过间接聚类提取广告的多类别特征,将多类别特征输入预测模型——因子分解机中对点击率进行预测。实验结果表明,广告多类别特征明显提高预测准确率;并且多类别特征提取过程中使用的间接聚类方法不仅可以实现对广告的多类别标注,而且有效地降低大规模稀疏特征向量的维度,显著降低聚类时间成本。
其他文献
通过对上海7家A级锅炉及部件制造企业监检过程中发现的制造问题进行了分类统计和原因分析,针对具体问题提出了预防措施;对锅炉质量危害严重的典型缺陷进行了深层次分析,突出了预
大豆含有丰富的蛋白质,是人和动物重要的蛋白来源,但是大豆同时含有多种抗营养因子,其中胰蛋白酶抑制剂是一种主要的抗营养因子,主要包括Kunitz类胰蛋白酶抑制剂和Bowman Birk类
随着经济全球化的不断深入与国际分工的日益细化,服务外包作为一种新的贸易形式,能够实现产业的结构调整与资源的优化配置,从而逐渐成为全球范围内新一轮产业转移的热点。因此,我
党的十六大以来,电力行业在党中央、国务院正确领导下,坚持以科学发展观为指导,加快结构调整步伐,取得了巨大成就,实现了跨越式发展,多项指标进入世界先进行列.随着我国在电力行业的
媒体公关是现代企业管理的重要组成部分,随着互联网技术的发展,各种新媒体形态渐次出现,正在引起企业媒体公关工作的巨大变化。较之传统的互联网传播方式,新媒体具有无可比拟
论文从列宁主义早期传入中国的基本情况、对列宁的悼念、传播内容及对中国的最初影响入手来具体研究列宁主义在中国的早期传播。特别强调列宁主义在中国早期的传播,对中国革
目的探讨影响分化型甲状腺癌(DTC)肺转移131I疗效的相关临床病理因素。方法回顾性分析接受131I治疗的47例DTC肺转移患者资料,通过SPSS 13.0统计软件对数据进行2检验、t检验
随着社会和经济的不断发展与进步,人们对于安全问题也越来越重视。其中,视频监控技术发挥着重要的作用,作为视频监控系统的核心部分数字视频录像机(DVR, Digital Video Recor
随着移动互联网和嵌入式终端技术的快速发展和普及,移动互联网已经成为人们访问网络的重要途径之一,通过用户的行为分析获得用户的需求是电信运营商抢占市场份额,提高业务增
<正> 肝硬化、晚期血吸虫病常因门脉高压,造成食道及胃底静脉曲张破裂而出血,是急性上消化道大出血的常见原因之一。因其起病急、出血量大,可立即出现失血性休克,并可诱发肝