基于数据挖掘的手机销量分析及预测

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:wjsxyxjc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当今互联网快速发展的时代背景下,线下支付、电子商务、O2O、社交媒体等行业都在不断的崛起,智能手机在其中起着至关重要的作用,也越来越多的影响和改变着人们的生活和工作,逐渐成为一个人手必备的大众消费产品。由于电子商务行业的迅猛发展,人们的购物方式也发生了重大的变化,从传统的线下购买逐渐转变为如今的线上购买,为手机市场开辟了新的销售渠道。从电商的角度出发,手机的销量问题极大地影响着经营的收益、商品库存量的确定以及营销方案的制定。如果能够通过建立模型较好地预测各种型号的手机销售量,电商可以确定合理的库存量以实现收益最大化,并且可以及时获取用户需求,把握商品未来的市场趋势,也便于顾客在各种类型的商品中进行挑选和购买。近年来,数据挖掘算法和机器学习技术不断成熟,逐渐得到了广泛的应用。决策树、随机森林、神经网络、支持向量机(SVM)等方法不同于传统的线性回归模型,不需要满足对数据分布的假定,预测效果也比较理想,所以逐渐被应用在统计预测模型中。由于在手机销量预测模型中,需要考虑到的影响因素众多,模型可能会较为复杂,因此本文将利用数据挖掘方法进行建模分析。论文基于网络抓取方法从某电子商务网站收集了3327条手机信息,选取包括销量、价格、品牌、内存、操作系统等影响手机销量的32个关键因素。首先对数据进行预处理,并用Boruta算法和Lasso方法进行初步的变量筛选,剔除掉对模型贡献率小的因素,以降低模型的复杂度,最终筛选出21个变量进行下一步的分析。而后对训练集数据建立预测模型,主要采用的模型是支持向量回归模型、BP神经网络回归模型和随机森林回归模型,经过反复调整参数,达到各个模型的最佳拟合效果。为评价模型性能的优劣,使用五折交叉验证方法对比三种模型的预测效果,结果显示随机森林回归模型效果最好,性能最优。最后使用测试集数据对三种回归模型进行预测误差检验,对比各个精度评价指标,表明随机森林回归模型是最佳的,其对于手机销量预测具有一定的参考价值。
其他文献
区域经济与生态环境之间存在一定的相关关系:一方面,区域经济的发展为生态环境的保护与改善提供经济支持与技术保障;另一方面,良好的生态环境为区域经济的发展奠定了物质基础
测定不同冻融循环次数的混凝土氯离子含量,应用二维扩散理论模型计算混凝土氯离子扩散系数.结果表明:混凝土中的自由Cl-浓度(Cf)随着扩散深度的增加而降低,随着冻融循环次数
随着科学技术的发展和理论研究的深入,带有时滞的非线性问题已经引起了数学、物理学和机械工程学等许多领域研究人员的关注,但对于此类问题的求解是非常困难而又极为重要.目前对于研究时滞非线性的方法主要包括增量谐波方法、多尺度方法、同伦摄动法和同伦分析法等,其中在近几年使用较为广泛的就是同伦分析方法.此方法在根本上克服了摄动理论对小参数的依赖性,适用范围较广.另外,同伦分析方法提供了一个简便的方法,保证所获
目的评价心脉隆注射液治疗慢性心力衰竭(气阳两虚、瘀血内阻证)患者的有效性及安全性。方法采用随机、双盲、安慰剂平行对照的方法,将238例诊断为慢性心力衰竭,中医辨证为气
文章主要从文化的视角探讨了"五岳"名称如何从岳、四岳,并最终发展到五岳的过程,及五岳具体指代山体的变化。古文献最早出现的"岳"指代的是山水神灵,"四岳"演变为天子王土中
云南石漠化面积288.20万hm2,占总土地面积1 877.40 hm2的15.35%,分布在11个州市的65个县(区或市),其中以昆明、昭通、曲靖、文山、红河、丽江、迪庆、临沧、保山、大理等岩溶
分析Φ219 mm×8 mm(Q235B)小直径高厚径比螺旋缝焊管在生产过程中出现的成型、焊接难点——错边、成型缝"噘嘴"、裂纹和内焊工装安装空间小及焊缝外观形貌控制难等问题,并提
宁洱井的水位自2014年10月25日以来持续下降39.2cm,低于正常水位谷值8.335m,2015年的年变幅度为正常年变的57.8%,呈破年变现象。经现场调查,发现周围观测环境干扰小,水位变化量相对可
衰老是一种不可避免的生物学过程。随着全球人口老龄化的来临,衰老已经成为科学家们不得不面对的问题。如何提高大脑可塑性延缓衰老呢?通过核磁共振成像(MRI)和正电子放射断
近年来,越南已经成为国际投资的热点地区,也是我国实施“走出去”战略的重要目的地国。越南具有较好的投资环境,比如,良好的地理区位,丰富的自然资源,低廉的劳动力资源,优惠