基于机器学习的互联网广告点击行为预测研究

来源 :天津财经大学 | 被引量 : 0次 | 上传用户:mj73182
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网时代的发展,以电视、广播、报纸、杂志作为媒介的传统广告业受到冲击,收入呈现负增长趋势,而互联网广告业表现出强劲的增长趋势。为获得更好的广告效果,互联网广告的投放方式逐渐由粗放型向精细化转变。点击行为的精确预测不仅有助于增强广告受众的浏览体验,而且会促进广告主投放广告相关商品的推广,同时,广告平台也能获得更多收益。广告点击行为的相关研究越来越受到重视,在当前研究中,逻辑回归模型被广泛应用于广告点击情况预测,该模型复杂度低,但是模型无法自动组合特征,随之,集成学习和深度学习算法被引入。如何合理运用算法来准确预测用户对广告的点击行为,值得我们关注。本文采用2020年全球校园AI算法精英大赛公布的广告数据作为实证数据源,根据用户基本信息、广告信息、设备信息以及用户操作信息判断用户是否点击广告。在数据预处理方面,为获得更好的预测效果,在原始特征的基础上进行特征构造。根据特征组合后统计的点击数差异程度保留了年龄段与广告创意类型、性别与广告创意类型以及省份与广告创意类型的组合特征,弥补原始数据缺少组合特征的不足。针对数据的高维稀疏特性,将这类特征按广告曝光数进行聚类达到降维目的。针对广告数据类别不平衡的特点,本文利用不同的采样方法使数据类别平衡,方便后续处理。在预测算法上,本文在单一模型中选择了逻辑回归算法进行预测。在集成学习算法中选择了GBDT算法和Xgboost算法进行预测,在深度学习算法中选择了Deep FM算法进行预测,并对算法调参过程进行了详细介绍。对于不同算法,从预测准确性和算法运行消耗时间两方面进行对比,根据数据类别不平衡的特点,选择AUC值作为评价算法预测效果的指标。最终发现,利用混合采样方法处理数据后,再利用Xgboost算法来预测所得效果更好,AUC值能达到0.7912。综上所述,本文从实际数据着手,解决互联网广告点击行为预测过程中的问题,不断提升预测的效果。针对选取的数据,本文给出了具体解决方案,具备一定参考价值。
其他文献
我国于2002年步入老龄化国家行列,截止2020年底,我国65岁及以上老年人口数量已达1.9亿,占人口总量的13.5%,成为世界上老年人口数量最多的国家,老龄化速度位居世界前列。与此同时,社会养老负担不断加重,家庭规模呈现少子化、小型化的普遍趋势,家庭养老功能渐渐减弱,传统的家庭养老模式遭受强烈打击。随着经济的发展和医学水平的提升,老年人已不再满足于物质需求和生理健康方面的基本需求,认为心理健康和
学位
随着经济体制改革的不断深化,大数据、区块链等新兴技术的高速发展,营商环境建设的逐步加快,纳税人法治观念和维权意识不断增加,基层税务机关税收执法工作面临着更多的新问题和新挑战。面对这样的情况,目前我国的基层税收执法环境已经发生改变,如何去适应并且做好执法风险防范工作,这已经成为税务机关在执法的过程中必须要解决的问题。为深入分析基层税务机关税收执法风险及防范问题,本文结合X县税务机关的实际情况,运用税
学位
近年来,商业银行的信贷规模一直保持快速增长,信用卡发放量更是呈现逐年上升的趋势,但信用风险问题也随之突显。在此情景下,面对大量的信贷申请,如何快速且准确地完成申请者的信用风险评估,不仅已成为各商业银行重点关注的问题,而且也引起了学术界越来越多的学者所关注。关于信用风险评估,机器学习算法的应用逐渐受到学界和业界的认可。然而,国内研究大多基于较单一的模型展开评估,基于多模型相融合视角展开的研究尚不多见
学位
在我国老龄化程度日益加深的背景之下,城市社区居家养老服务成为解决养老难问题的一剂良方,尤其是在民族地区,受传统民族文化影响,老年人大多难以接受机构集中养老,而愿意选择城市社区居家养老服务,同时民族地区城市社区居家养老服务的开展有其特殊性,包括养老服务需求以及开展服务环境等均存在一定特点。T市为内蒙古东部的地级市,为少数民族的聚集区域,是全国蒙古族人口最多的地区,养老问题受到民族传统文化的影响比较深
学位
第一部分 加速康复外科理念在老年妇科恶性肿瘤患者围手术期中的应用目的:探讨加速康复外科理念在老年妇科恶性肿瘤患者围手术期中应用的临床效果,评估其安全性、有效性及可行性。方法:1.选取2016年1月至2021年12月期间于承德医学院附属医院经妇科手术及病理确诊为妇科恶性肿瘤且年龄大于等于60岁的住院患者,符合标准者239例。依据2019年1月起实施ERAS理念将2016年1月至2018年12月行传统
学位
随着我国经济持续高增长和资本市场快速发展,财务舞弊有越来越严重的趋势。在这种情况下,如何对上市公司财务风险进行准确预警受到广泛关注。有些上市公司在发生财务危机时,为了维持上市地位所需的财务条件,存在粉饰财务数据的动机。面临财务危机越大,粉饰意愿越强烈。低质量财务数据会大大降低财务预警模型的准确率。因此,有必要考察数据质量对财务预警模型的影响。财务预警模型本质上是一种分类模型。传统的分类模型都假设不
学位
在人口老龄化趋势不断增强的背景下,养老问题日益紧迫和突出,面对强劲的养老需求,政府要采取有效化措施加强养老服务供给,让更多的老年群体享受到优质且高效的养老服务,而政府要优化养老服务供给、实现市场供需均衡,关键途径是向社会力量购买居家养老服务。近年来,内蒙古自治区呼和浩特市人口老龄化问题越发凸显,已然成为制约当地经济发展的重要因素,面对这一情况,呼和浩特市政府大力推进居家和社区养老服务体系建设并取得
学位
人类社会发展的篇章里,矿产资源谱写了浓墨重彩的一笔。改革开放以来,在矿产资源领域,我国进行了大规模的开发利用,加快了工业化现代化进程。但是,由于早期矿产资源开发方式的“粗放”和“无序”,矿产资源消耗急剧增加,地质灾害、空气污染、水土流失等环境问题接踵而至,生态破坏与发展需求的矛盾日益突出。内蒙古作为我国重要的能源、有色金属冶炼和煤化工基地,矿产资源开发一直是经济支柱产业之一。然而,长期开采矿产资源
学位
2020年4月,瑞幸咖啡财务舞弊事件登上微博热搜,引发了社会各界的关注和讨论,这并不是个例,随着上市公司数量的增加,国内外被曝光的财务舞弊公司也越来越多。另一方面,由于市场经济的高度开放和科技的发展,一定程度上使得财务舞弊手段更加隐蔽,加大了审计工作者的人工识别难度。财务舞弊带来的危害是巨大的,不仅使社会公众对资本市场丧失了信心,也严重阻碍了我国金融市场的稳步发展。因此寻找能够高效识别上市公司财务
学位
信息时代下,数字经济已经越来越成为促进我国经济发展和产业转型升级的核心引擎之一,对我国经济向高质量发展,人民生活水平的提高和抢占未来经济和科技发展先机有着至关重要的作用。我国数字经济在绝对值规模上仅次于美国,稳居世界第二。特别是在疫情期间,数字经济在推动复工复产,促进经济复苏方面起着不可替代的作用。数字经济蓬勃发展的同时,随之而来也带来了一些问题需要我们在税收方面做出应对。数字经济在我国已发展多年
学位