服务于广告推荐的用户特征模型研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:mars1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统作为互联网公司的增长引擎,对互联网公司来说,能够极大限度地吸引用户,留住用户,增加用户粘性,提高用户转化率,从而为公司达到商业目标连续增长的目的。各大互联网公司都在大力发展自己的推荐系统。效果好的推荐系统则需要效果好的推荐模型,随着近年来深度学习的崛起,深度学习对推荐系统在推荐模型的发展具有革命性的贡献,与传统机器学习推荐模型相比,深度学习模型一方面具有更强的特征组合挖掘能力,另一方面具有更强的数据模式的拟合能力。在构建推荐系统的过程中,推荐系统模型固然重要,但绝不意味着模型就是全部,特征工程也具有非常大的作用,好的特征往往能达到事半功倍的效果,为了构建出好的特征工程,人们对此进行了大量的研究。腾讯公司作为国内最大的社交网络公司,旗下的产品例如微信,腾讯QQ,腾讯新闻等掌握着巨额的流量,和国内很多很公司进行深度合作,在腾讯的各大平台上通过广告来推广其他公司的产品。为了达成较好的广告推荐效果,需要一个较好的特征工程来帮助模型实现其效果,本文就是在腾讯公司的数据基础上提出一个新的特征扩散解决方案来帮助公司构建好的特征工程。广告主为了获得好的投放效果,往往会将自身旗下的第一方数据上传给腾讯公司。本文就是对其中的第一方行为数据挖掘较为有用的特征,由于一方行为数据较为稀疏,从其中获得的特征尽管在公司离线验证平台上对模型有效,但是特征所包含的用户覆盖程度不够,使得模型的效果不够置信。为了使特征更加令人信服,本文提出了两阶段的模型解决方案来解决用户覆盖度问题。第一阶段为行为生成阶段利用已有的活跃用户画像数据,采用本文改进的Transformer模型对用户行为序列进行生成预测。第二阶段为特征建模扩散阶段利用行为生成阶段生成的用户行为序列,结合腾讯的精准用户画像,通过本文提出的FMBST模型进行时序建模,将在NLP领域中大放异彩Transformer经过改良引入深度学习广告推荐系统,对特征在全量活跃用户进行扩散,进而解决特征的覆盖度问题。本文提出的FMBST模型,对三部分输入进行不同处理。公司内部精准的用户画像通过多层全连接层,用户的历史行为按照时序模型通过Transformer,将二者的输出进行拼接后,交由多层全连接层处理,最后和行业有关的画像通过FM的结果一起对相应特征进行回归。通过和目前主流深度学习推荐系统模型Wide&Deep,Deep FM,DIN,DIEN,BST相比,本文提出的FMBST在特征回归的效果,线下和线上验证的评估均取得了最优异的成绩。FMBST不仅可以用于相关特征的扩散,还可以用于CTR/CVR预测任务,和主流深度学习模型进对比,同样取得了较为优秀的结果。本文最后总结了FMBST相对于其他所模型的优缺点,并且未来对进一步优化FMBST模型的效果和效率进行了进一步的展望。
其他文献
<正>提高学科教学质量,集体备课当然必不可少。可作为数学教研组长的我最近有点儿烦:集体备课,总有几个老师姗姗来迟;还有的人到了,你说你的,他玩他的,一心扑在手机上;甚至有老师当面向我抱怨:“备什么备啊,还不是走形式,耽误时间?”……无奈,向一位同人请教。她说:“这个啊,也许还得从咱们自身开始改。我近来正在试验一种‘问题驱动’的集体备课方式,
期刊
近年来,中国手机市场的竞争日趋激烈,手机开发商在不断进行技术创新和系统升级的同时,也承担着介绍功能操作、接受使用建议、提供售后服务和解决用机问题等责任。作者实习所在的小米科技公司为了给MIUI系统的用户提供更加优质的服务,结合小米社区的设计理念以及当前应用移动化、轻量化的趋势,开发了一款MIUI系统内置App——服务与反馈,综合解决了以上提到的问题。但是,MIUI系统支持多种语言,覆盖上百个国家,
学位
随着国家全面推动实体经济的发展,作为实体经济主体的中小企业在我国经济社会的建设中发挥着重要作用。目前,很多中小企业在发展过程中受人力与资金的限制,仍然采用纸质化办公,或是直接引入市面上现有的通用ERP系统等方式进行企业资源管理。传统的纸质化办公方式效率过低,且难以处理企业经营过程中经常动态变化的数据。直接引入通用的ERP系统在多数情况下只能满足基本的管理工作,而无法适用于业务相关的定制化需求。本文
学位
随着社会化媒体平台兴起,公共事件的传播无远弗届,热点事件能够在社交媒体上引起广泛讨论,公共事件传播模式也相较于传统媒体时代发生了变迁。因此,本文提出问题:有哪些因素显著地影响公共事件传播影响力?本文以定量研究为主要研究方式,将公共事件传播影响力分为传播规模、传播峰值速度、传播持续时间,通过文献回顾,确定影响公共事件传播影响力的四个方面:媒体议程设置、意见领袖、公众参与、事件本身,爬取公共事件平台“
学位
本项目是在公司实习期间完成的分布式限流和限制并发服务,目前已经完全上线并使用半年,稳定且准确。随着公司业务迅速发展,甚至支持了大型的节日宣发活动。如果没有一个限流和限制并发服务的支持,则会导致下游业务方无法承受突发的流量,引起业务雪崩。所以,必须开发一个限流和限制并发服务来支撑公司项目。对于限流服务而言,调研目前市面上的开源项目如Sentinel等都无法在高qps(每秒发送的请求个数)下支撑一个分
学位
随着互联网技术的迅猛发展,线上电子商务的规模迅速扩张,作为一家以电商为主要业务的创新型互联网企业,公司的业务不断扩大,需求与日俱增。为了促进消费、增强企业竞争力,公司会推出各式各样的营销活动来吸引用户,多样的线上营销形式会产生包含繁琐工作的前端页面开发的需求,比如营销活动的表单配置页面、活动效果展示页面等。这些页面都有这样的特点:在功能和逻辑上大同小异、需求比较高频、研发的性价比很低、开发的过程繁
学位
"工欲善其事,必先利其器",要想优化课堂教学、提高教学效率就要认真研究备课。尤其是面对新课改,没有现成的经验可言,大家都是在实践中探究,在探究中总结经验,这就更要发挥组内同仁的作用,正可谓:仁者见仁,智者见智。集体备课有利于发挥教师群体的智慧,弥补每位教师备课中的不足,取长补短,资源共享,共同提高。
会议
【目的】牙周骨缺损修复是牙周组织再生研究中的热点及难点,本课题旨在探讨炎症微环境下BACH1对人牙周膜细胞成骨能力的影响,为修复炎症环境下的牙周骨缺损提供理论依据。【方法】采用组织块联合酶消化法分离培养人牙周膜细胞(hPDLCs),CCK8法检测细胞增殖活性,成骨诱导hPDLCs 21天后茜素红染色实验评估细胞的成骨能力。利用大肠杆菌脂多糖刺激巨噬细胞,收集条件培养基刺激hPDLCs以模拟炎症微环
学位
当前,组合投资及组合绩效分析在理论和实践中快速发展,智能高效的组合投资管理及分析系统对于投资者研究组合投资策略、灵活调整组合资产配置、积累投资经验、规避投资风险和提高投资收益具有重要意义及研发价值。华泰证券是我国领先的科技驱动型综合证券集团,本文以华泰证券组合投资相关业务需求为开发背景,介绍了华泰证券模拟组合投资及绩效分析系统的设计与实现。本系统解决了用户对于投资组合管理、模拟组合投资实操、策略研
学位
【目的】本研究借助深度学习的手段,探究在头颅侧位片下自动识别骨性错(牙合)畸形的准确性,并探索利用软组织侧面照实现骨性错(牙合)畸形特征面容区分的可行性,为骨性错(牙合)畸形诊断、筛查和特征总结做尝试。【方法】1.收集南京市口腔医院2017年1月至2018年6月间接受正畸治疗的初诊头颅侧位片样本共2109例,侧面照样本共2040例。根据Steiner的经典研究,骨性Ⅰ类错(牙合)畸形满足[0°≤A
学位