论文部分内容阅读
近年来,随着互联网科技的飞速发展,在线广告逐渐成为各大互联网企业的主要盈利方式。因此针对提升用户对广告满意度,提高广告主利润的研究越来越重要。其中常见的研究围绕利用海量的用户点击日志挖掘用户个性化信息这一方向进行,而研究中最重要的问题是如何提升广告点击率预测结果的精度。目前常见的广告点击率预测方法依赖用户对广告的历史点击数据学习模式进行预测。然而用户对广告的历史点击数据中用户行为数据稀疏以及用户属性缺失的特点,对现有广告点击率预测方法提出了很大的挑战。本课题针对这一挑战,引入了更高效的广告图片特征来改进现有的图片广告点击率预测方法。改进方法的核心思想是通过高效的广告图片特征为新广告找到相应的相似广告,利用相似广告的历史信息提高新广告的点击率预测精度。本课题先分析了现有的图片广告点击率预测方法,以及其中相关技术的的原理。接着对当前图片广告点击率预测方法中广告图片特征提取以及用户属性推断两个环节进行研究。针对这两个环节中,广告图片视觉特征的表示能力有限、任务独立问题和用户属性推断的数据稀疏记录预测精度偏低问题进行改进。为了解决这些问题,本课题利用深度卷积神经网络模型图片特征表示能力强的特点,设计了一种新的广告图片特征学习架构。利用这一架构,本课题从原始广告图片和用户反馈信息中抽取了广告图片高层抽象特征。这种方式相比传统的图片特征提取方式提取的特征更加灵活,适用于点击率预测任务且不需要人工筛选组合特征。通过引入广告图片高层抽象特征,改进了现有的用户属性推断方法。并将广告图片高层抽象特征与点击率预估模型相结合进行预测,缓解了图片广告点击率预测中数据稀疏造成的新广告点击率预测低的问题。本课题的实验使用2014CCF大数据技术创新大赛腾讯公布的大约1G的图片广告点击日志数据。实验结果验证了改进的图片广告点击率预测方法能有效提高新广告记录的点击率预测精度。该改进利用本课题提出的广告图片特征学习架构更好的表示了用户对广告图片的反应,从而实现新广告记录点击率预测结果精度的提高。