基于xDeepAFM模型的货物点击率预测

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:z245713805
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“十四五”规划明确提出产业数字化转型,积极推动数据赋能全产业链。中国信息通信研究院发布的《中国数字经济发展白皮书》显示,2020年我国数字经济规模达39.2万亿,占GDP比重为38.6%,同比增长了9.7%,数字经济总量跃居世界第二。国家统计局公布2021年前三季度与数字经济相关的高技术制造业、信息传输、软件和信息技术服务业均领跑产业发展,数字经济是经济增速发展的重要推动力量。货运行业的数字化转型,催生了物流货运互联网平台。网络货运平台需要在数字经济时代抓住机遇,并且促进数字经济发展。已经是世界第一大公路运输市场的中国,公路规模和集中度的增长进一步推动公路物流的发展,这对于网络货运平台来说是一次机遇也是挑战。对于网络货运平台来说,货物点击率是平台关注的一个重要指标,可以衡量用户对平台推荐的忠诚度。对货物点击率进行预测,可以有效地了解用户司机与平台货物的匹配度,可以衡量货物投放的精准度,提升货物点击率可以同时给平台、货主、司机三方带来好处。但目前涉及机器学习的学术界和工业界大多关注广告点击率,传统的点击率预测模型以及最近的基于深度学习的一些模型主要是在广告数据集进行的,公开数据集也大部分涉及广告点击率,对货运平台中的货物点击率并没有太多涉及,还有一些物流专业相关的学者主要研究物流行业发展现状和趋势以及货车出行路径。本文将推荐系统中的点击率预测模型应用到物流领域,从另一个角度来探究点击率预测模型,本文的创新点表现在:(1)选取货物点击率作为研究对象,对目前提出的一些经典的点击率预测模型进行分析和研究,总结梳理模型的优缺点;(2)提出了一种AFM、CIN和DNN相结合的x Deep AFM模型来进行预测,预测效果在该数据集上得到了很好的提升。主要内容安排如下。(1)对数据集进行数据探索,分析各个特征与标签的关系,进行可视化等步骤去了解数据的基本信息,针对探索得到的信息进行数据预处理以及特征工程;(2)介绍x Deep AFM模型提出的理由以及组合该模型的各个组成部分,各个组成部分的优势以及不足;(3)运用本文提出的模型和几个经典的点击率预测模型进行对比,训练结果显示低阶特征模型中最优的结果AUC值为0.8229,Log Loss值为0.1022,高阶特征模型中最优的结果AUC值为0.8319,Log Loss值为0.0994。而本文提出的模型AUC值达到0.8467,Log Loss值达到0.0978,预测效果得到显著提升;(4)最后进行总结并提出相关建议。
其他文献
随着电商行业的不断发展,电商企业商品的种类和交易额不断增加,但相应的资产评估模型没有随之配套发展,中小型店铺面临融资难、库存成本高等问题,电商商品短期的销量预测非但能对企业或个人经营者在货品库存的补货计划里起协助作用,且根据预测的结果作出适宜的库存决策可以有效地降低货品的库存成本。然而由于电商商品销量波动具有变异幅度大、不同商品变动异质性等性质,电商交易下的销量异动所受影响因素繁众,这些特征给短期
学位
随着经济持续发展,共同富裕理念的推进,减少区域之间差距,促进区域协调发展的重要性不言而喻,其中创新作为经济发展的内在动力,技术创新是造成区域差异的根本源泉,五大发展理念中的“绿色”与“创新”理念的深入贯彻与落实,推进绿色发展,加大创新动力具有重要现实意义。绿色创新兼具绿色发展与科技创新两大发展理念,在可持续发展要求下,绿色创新效率在创新效率发展的同时兼顾绿色收益,从而进一步加强对绿色创新效率的研究
学位
人口老龄化是当前全世界共同面临的一个问题。我国目前正处在人口老龄化的快速发展期,老年人对于医疗、健康和养老的需求明显高于其它人群。关注老年人的养老需求、完善养老服务体系是国家积极应对老龄化的重点。通过对老年人健康状况的预测,可以优化医疗资源配置、节约健康养老医疗资源,从而有利于健康养老医疗资源可持续发展,对优化解决我国较为多样的养老问题具有较大的现实意义。本文将老年人住院次数作为研究老年人健康状况
学位
股指期货自推出就受到投资者和学者的广泛关注,无论是作为风险对冲的工具,还是通过制定交易策略获取超额收益,都需要对其价格进行科学合理的预测。但因其受到金融市场中各种内外部复杂因素的影响,往往显示出非线性性和不稳定性,具有一定的预测难度。现如今大数据的主导地位愈加明显,加上人工智能技术的革新,将机器学习、深度学习等算法应用于股指期货的预测分析成为研究的突破点。基于此,本文提出一种将长短期记忆网络LST
学位
现今经济形势瞬息万变,无论是资本市场还是公司的经营状况,都有可能给公司带来财务风险,从而损害投资者和其他利益相关者的利益。因此为了减少公司的风险,上市公司的股东必须建立一种预警系统,以便在最短的时间内发现公司的财务状况是否会恶化,并采取相应的措施(例如调整经营方向和经营策略)。本文的研究分析主要由几部分组成:研究样本公司的选取、研究指标体系的确定以及筛选、研究过采样过程平衡样本数据分布、基于不同的
学位
随着我国社会主义市场经济的发展,证券市场的规模日益扩大,已成为国民经济的重要组成部分。实体经济很大部分是由大企业,特别是上市公司撑起来的。然而,由于中国开始发展经济的时间比较晚,市场上实施的监督、管理的举措和方法都需要增强。所以,准确预测和控制上市企业的财务困境是一种现实而又迫切的需要。上市公司财务困境预警模型的建立对有关监管部门、公司高层和股东都发挥着重要作用。本文以上市公司为研究对象,参考证监
学位
因近些年来人工智能和大数据的快速发展,以第三方移动支付平台为主要代表的在线支付模式已成为人们主流支付模式之一,随着移动支付规模的扩大,各类型的支付欺诈行为也日渐增多,对移动支付平台和内部生态、消费者造成了巨大损失,因移动支付欺诈有其隐蔽性、实时性、变化性,普通欺诈检测方法难以有效检测出问题,而目前人工智能欺诈检测技术日趋成熟,应用机器学习与人工智能技术解决金融欺诈检测问题成为近年来相关问题研究的主
学位
2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生学业负担和校外培训负担的意见》,“双减”政策的出台,旨在减轻学生和家长的教育负担,强化学校作为教育主阵地的作用,对教培机构加强治理,改善教育内卷的现象。“双减”政策对学生、家长、教师以及校外培训机构人员的生活的方方面面都产生了影响,在网上也引起网民们该政策的高度关注。同时由于大数据时代的到来,信息的传播变的更为迅
学位
随着国民文化自信、民族自信全面增强,传统文化的再次活跃引发“国潮热”。在这股“国潮热”下,外来国际品牌前进的脚步并没有停下,严峻的市场竞争促使国内运动品牌不得不再次思考如何在国内市场“站稳脚跟”,提高自身的竞争力。在线评论是一个低成本获取用户反馈的渠道,通过评论内容,可以获取用户对商品各个属性的情感倾向,可以为消费者购物提供参考和帮助商家提高产品质量。因此本文选取了国内运动品牌代表李宁和国际运动品
学位
经济全球化的逐渐深入,各国的发展非常迅速,国民经济发展较为迅速,带动了房地产行业的发展,房地产行业属于资金密集型产业,公司负债率较高,由于房价居高不下,居民的收入跟不上房价上涨的步伐,因此许多居民处于买不起房的处境,导致房地产行业大量房地产库存积压,产能过剩,我国的金融市场不稳定,缺乏一套完善的金融管理机制,房地产由于房屋销售过少,资金不够偿还债务,导致公司周转存在问题,存在较大的财务风险,加大了
学位