论文部分内容阅读
由于互联网中积累的广告日志具有数据稀疏、特征量大、正负样本分布极其不均匀等问题,使得人工特征提取费时费力,并且单一预测模型很难得到更好的预测性能。针对这些问题,提出梯度提升树GBDT和Stacking相融合的点击率预测模型GBDT-Stacking。通过引入梯度提升树自动进行特征提取与构造,并结合Stacking集成模型对在线广告点击率进行预测,有效提高了单个预测模型的性能。在真实广告数据集上的实验结果表明,GBDT-Stacking集成模型比对比模型在AUC的取值上至少提升了4%。