云环境下DM广告精准投放模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:morgan1912
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着云计算、大数据和物联网等高新技术的成熟及发展,推动传统DM(direct mail,译为“直投广告”)广告媒体行业的快速转型。在云环境的广告投放模型中,DM广告与用户数据量剧增,引起数据稀疏性和算法可扩展性难题,成为精准投放模型亟待解决的问题。目前传统广告投放从用户行为和内容定向两方面来建立模型,通过相似度计算来对用户进行划分,根据用户的共同行为特征或偏好内容进行广告投放。云环境下数据集极度稀疏性,使可用于模型训练的有效数据很少,无法准确找到用户或广告的最近邻居;而大数据量计算,需要耗费大量计算资源和时间,传统方法可扩展性较差。针对传统精准投放模型的弊端,本文以云环境下的DM广告为研究对象,基于二分k均值聚类和LBFGS优化的协同过滤算法提出DM广告精准投放模型,论文的核心工作如下:(1)针对DM广告投放流程,分析传统环境与云环境下广告投放流程的区别,以及云环境下精准投放方法和难点,提出本文要解决的关键问题,设计云环境下精准投放模型的两阶段算法。(2)研究广告精准投放模型的数据处理流程,基于二分k均值和Hadoop分布式数据仓库,对现有数据集转换和聚类分析,根据实时的用户特征与行为分析选择聚类簇,作为精准投放模型中协同过滤算法的数据输入。(3)提出一种基于L-BFGS优化的协同过滤算法作为精准投放模型预测方法,将用户和商品的特征进行组合,使用因子分解机模型(Factorization Machine,FM模型)预测用户对广告的偏好程度,同时降低数据稀疏性影响;使用L-BFGS算法作为FM模型的参数训练方法,具有收敛速度快和占用计算空间低等特点,提高训练FM模型的计算效率和可扩展性,满足云环境下预测精准度和计算效率要求。最后,基于Spark计算框架实现精准投放模型和设计数值实验进行验证。通过不同数据集并与其它三种方法进行实验比较,并分析算法收敛速度、特征数量和数据集大小对算法精准度的影响。结果表明:该模型在四个不同规模的数据集上都有最高的预测精准度,在适当增加迭代次数和数据集特征可得到更好的结果,验证了精准投放模型的有效性。本研究为探索云环境数据极度稀疏情况下的DM广告精准投放问题提出新思路。
其他文献
目的探讨慢性自发性荨麻疹(chronic spontaneous urticaria,CUS)患者血清白介素35(interleukin 35,IL-35)、转化生长因子β1(transforming growth factorβ1,TGF-β1)的水平
朱自清《背影》收录在8套中文科教科书的单元内,而8套教科书8个单元内的学习重点和教节安排都不同,展示了教科书单元组织选取和使用学习材料(篇章)或有不恰当的情况,以致未能
以天麻提取液为基本原料,建立了完备的高纯度天麻素高效制备液相色谱方法,制备了天麻素标准物质,并以紫外、红外、质谱、核磁共振波谱对其进行结构表征。以高效液相色谱法结
目前,智能建筑工程项目管理能力良莠不齐,许多项目经理都是从传统项目转岗而来,智能建筑项目管理水平较低,如何有效防范智能建筑风险,这是项目管理人员需要认真思考的问题。
从一定意义上说,城镇化就是城镇空间的生产、发展和转换的过程。传统城镇化偏重城市空间发展,推动乡村空间向城市空间的急速转换,导致乡村空间被剥夺、边缘化和遭隔离,使城乡
对湖南大学配电自动化系统的工程作了简要介绍。配电自动化系统采用统一规划的设计原则 ,充分利用各种设备和信息资源 ,完成对整个配电网的监控、经济运行 ,以提高供电可靠性
文章通过对新疆库尔勒市新城区基督教堂信众结构的个案分析,指出新疆近年来基督教信众具有:年龄跨度大,年轻人有增多趋势;女性信众多,男性信众有增多趋势;退休人员、家属和个
<正>春风起,但气温还是乍暖还寒。温度如过山车般忽上忽下,于是"脱大衣、洗大衣、收大衣、找大衣、穿大衣、脱大衣……"成为很多人每天忙碌的事。显然,大衣、羽绒服等衣服在
期刊