基于多类别特征的在线广告点击率预测研究——以腾讯搜搜为例

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hulianwu2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线广告点击率对搜索引擎服务提供商和广告商都是一个重要的量化指标。因此,在线广告点击率预测,是计算广告领域的关键问题之一。工业界与学术界都对点击率预测问题有持续的研究,各个搜索引擎服务提供商都建立了自身的点击率预测体系,可见本课题具有很强的理论研究价值和实际应用价值。   本文围绕点击率预测问题,进行了完整的研究方法建模。首先对搜索引擎在线广告进行特性研究,总结出五大特性;在此基础上,定义广告显式特征和隐式特征,进行相应特征提取;并将概率关系模型引入特征选择阶段,将特征分为与真实结果直接相关、间接相关、完全无关三类;然后引入因子分解机模型作为预测模型对广告点击率进行预测,输入端为进行特征选择后的实值特征向量;最后采用曲线下面积(AUC)对预测结果进行评价。   值得重点提出的是,在当前研究中,对于特征提取主要强调位置以及广告属性特征,缺乏考虑广告被触发的场景以及广告与用户检索词的联系;已有的基于广告类别特征提取预测广告点击率采用同一类别的广告点击率平均值直接对待预测广告进行预测,无法将广告类别与其他特征混合加强进行预测;对广告直接进行聚类也可以得到广告类别,但是这样只能得到广告的唯一类别标注(本文定义其为广告类别特征)。在线广告本身具有多主题性,单一类别标注在不同的用户检索行为下失去意义。由此,本文提出一种基于广告多类别特征的点击率预测方法:定义用户检索行为对广告的触发作用,通过间接聚类提取广告的多类别特征,将多类别特征输入预测模型——因子分解机中对点击率进行预测。实验结果表明,广告多类别特征明显提高预测准确率;并且多类别特征提取过程中使用的间接聚类方法不仅可以实现对广告的多类别标注,而且有效地降低大规模稀疏特征向量的维度,显著降低聚类时间成本。
其他文献
2014年以来,国家新闻出版广电总局每年设立千万元专项资金,用于扶持和补助广播电视公益广告优秀作品和优秀传播机构,吸引了事业单位、社会公司、高等院校等社会各界参与到广
随着互联网技术的不断发展,互联网承载的业务种类越来越多并且业务量越来越大。采用WDM技术的全光网络能满足人们对网络带宽和QoS要求。但是光纤很容易受到破坏,一旦网络中的
量子时间同步技术是目前理论精度最高的时间同步技术。而要实现这种高精度时间同步技术,首先最重要的便是获得良好的量子频率纠缠源。研究表明,量子频率纠缠源的频率纠缠特性与
本试验以三种番茄抗性砧木Beaufort (L.esuclentum ×L.hirsutum)、Energy(L.esuclentum ×L.esculentum)和He-Man(Lesuclentum ×L.hirsutum)为材料,通过研究番茄离体培养各
尽管引入了中继(relay)、协同多点传输(CoMP)等技术的下一代宽带蜂窝移动通信系统(IMT-Advanced)在小区覆盖、边缘用户体验等方面较3G网络有更为优秀的表现,但由于以基站为中
摘要:本文针对如何加强化学教学中的安全意识教育展开了探究,以期给我们的教学带来启示。  关键词:化学教学;安全意识教育;教师;学生  中图分类号:G633.8 文献标识码:A 文章编号:1992-7711(2017)10-0086  一、重视安全意识的培养是保证实验教学工作顺利开展的前提  化学是一门以实验为基础的自然科学,做化学实验是化学教学中最具有魅力的环节,它不仅能满足学生的好奇心,增强学生
随着Internet技术在全球范围的飞速发展,链路流量几乎每年成倍增长。在不久的未来,可以预见由于Internet技术源于不同目的的扩展,数据流量会出现一个暴涨期。这些变化促使许
在石油勘探领域,地震波勘探系统已历经六代的发展和更新,主流勘探系统绝大多数采用有线传输模式。然而在勘探作业过程中,线缆长度长,质量重,面对目前日益复杂的勘探地理环境,铺设有
本研究分别用不同浓度的雌激素E和雄激素MT浸泡处理孵出后5d的泥鳅和大鳞副泥鳅,120d后解剖性腺确定性别比例:在cDNA水平克隆两种泥鳅雌激素受体基因,对其进行序列分析,并比较其
由于通信网络中带宽资源是受限的,而用户数、用户对业务质量的需求却一直在不断增大。那么如何使资源得到更合理的配置和利用,这就是无线资源管理的目标。无线资源管理需要采