基于流数据挖掘的客户细分研究

来源 :中央财经大学 | 被引量 : 0次 | 上传用户:cdp850911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
客户细分工作在保持存量客户,发掘潜在用户以及差异化营销方面发挥着重要的作用,不断变化的客群特征要求客户细分需要有较强的时效性,要求管理人员动态调整客群划分,这需要快速和准确的划分策略予以支持。随着数字经济的发展,互联网企业积累了大量的数据资源,应用大数据和机器学习方法开展客户细分及购买倾向预测工作,并取得了显著的效果。但是海量和快速更新的数据,使得静态数据挖掘算法的训练产生了巨大的计算和储存空间开支。而基于流数据的增量更新算法能够在有限储存占用及单次扫描的约束下完成聚类和分类等挖掘工作,且能够在海量数据实时更新的条件下动态调整算法的决策规则。基于以上问题,本文开发并改进了一种先聚类后基于聚群结构进行近邻分类的流数据分类算法,以实现分类问题增量更新任务,同时捕获群体结构变化特征。经过模拟和真实数据集的测试,实验结果表明该方法能够较好的对流数据进行聚群划分,及时有效地捕获数据流的偏移,在流数据分类问题上有着较好的表现。进一步将该方法应用于电商平台的用户点击流数据中,用于发现群体聚群特征,并在聚群的基础上进行分类预测,找出各聚群中购买倾向较高的用户群体,为电商平台的营销方向和对象提供参考,结果表明该算法能够有效预测用户的购买倾向,能够辅助决策人员制定有针对性的营销策略。
其他文献
社交媒体数据的体量随着网络技术的发展得到了飞速增长,而社交数据能够真实反映用户的心理、情绪等信息,除此之外对一些有害信息进行及时鉴别也是十分必要的。而随着移动设备的发展,越来越多的用户选择在社交媒体上分享自己的视频、图像、音频等数据,社交媒体数据已经呈现多模态化的趋势。然而对多模态数据进行分析仍然存在许多问题,主要包括了模态间数据表现形式不统一的问题以及模态间表征内容不统一的问题。受限于模态间数据
学位
随着计算机及其相关技术的发展,如何将数字化与文物研究更好地结合是很多研究者关注的热点问题。工业CT技术能够在不损伤文物的前提下得到文物的内部信息,通过这些信息可以实现文物的三维建模。基于CT断层图像进行三维建模的常用方法是面绘制算法和体绘制算法。本文主要基于面绘制的切片级重建算法展开研究,从轮廓对应、轮廓分支和轮廓拼接三个方面展开讨论。针对轮廓对应和分支存在多义性与不确定性问题以及轮廓拼接存在准确
学位
2020年初突然爆发的新冠肺炎严重影响了全球人民的正常生活。至今新冠疫情仍然不断反复,是21世纪以来人来面临的最大公共卫生危机事件。随着互联网技术的发展,在疫情防控的过程中新闻媒体起到的作用受到了专业人士的肯定。新闻传播在稳定民众情绪,引导正确的舆论导向以及帮助维持社会秩序上起到了重要的作用。目前有关新冠肺炎相关新闻的研究还处于初级阶段,主要研究都是通过新闻学的视角来研究媒体舆论导向以及新冠肺炎对
学位
“双循环”新发展格局于2020年5月中央政治局常委会会议首次被提出,引发学者热议。但当前学术界的研究主要集中于理论层面,需要更多的实证分析来对其进行验证。本文从内外需求的视角出发,对“双循环”新发展格局的相关概念进行了阐述及定义;然后基于全球价值链的GDP分解方法,结合本文对内外循环的定义建立新的模型,将一国的GDP分解为消费内循环增加值、投资内循环增加值、简单外循环增加值与复杂外循环增加值两大类
学位
随着计算机技术的不断发展,机器感知与人类认知也愈发趋于统一。在此背景下,传统的二维数据模型因已无法满足在计算机中对三维世界进行表达的需求,逐渐被三维数据模型所取代。在众多三维数字化模型中,由于点云模型具有易采集、几何特征丰富等特点,使其发展成为三维模型处理中一种极其重要的数据载体。然而,由于点云模型中各样本点的无序分布和缺少潜在的拓扑连接关系,使得点云模型的后续处理工作变得十分复杂,因此对三维点云
学位
随着智能手机等便携式GPS设备的普及,高效地收集包含丰富时空信息的旅客GPS数据成为可能。对大量的旅客GPS数据进行轨迹挖掘,一方面有助于管理部门理解城市旅客的出行模式,为交通调度、城市规划等宏观政策提供支持;另一方面,也能够帮助描绘旅客画像,服务于基于位置的广告推荐、旅客目的地预测等任务。本文针对GPS轨迹挖掘中的旅客轨迹分段、交通模式识别和目的地预测三个关键问题展开研究。主要贡献如下:(1)提
学位
金丝猴面部识别是金丝猴行为识别研究的重要前提,但基于金丝猴面部特征的个体身份识别面临诸多挑战,包括:不同金丝猴个体面部特征的相似性大以及新个体身份难以准确标记和识别等。为此,本文提出了分级集成网络(Hierarchical Ensemble Networks,HE-Nets)以及基于孪生网络和深度特征聚类算法的自监督新个体识别算法(Self-supervised New Individual Re
学位
随着自然语言处理技术(NLP)的发展与计算性能的提升,计算机对人类自然语言的分析、处理能力在近年来得到了飞速发展。情感分析作为NLP领域的一个重要任务,从20世纪开始就有学者进行研究。所谓情感分析任务,就是对于给定自然语言文本,使用自然语言处理方法对其进行情感语义挖掘,包括情感分类、情感打分、意图识别。早期的情感分析任务,一般是以句子或篇章为单位的粗粒度情感分析,然而随着研究的深入,人们认识到,一
学位
证券投资基金已经有着150多年的历史,对于国外来说已经有着较为稳定的基金市场,以及与基金相关的伴生产业。而我国基金发展于上个世纪90年代,经历了4个阶段,虽然已经进入了稳步发展阶段,但是却并没有较为完整的基金评级体系。随着我国经济和人们生活水平的日益提高,不断的投资者涌入基金行业当中,暴露出了其中问题。投资者并没有着较多的金融知识,在投资过程中资源无法较好的利用。因此提出新的行之有效、简单明了的基
学位
互联网行业在我国蓬勃发展,与各行各业深度融合。如今,我国开启了向第二个百年奋斗目标进军的第一个五年,要坚定不移实施网络强国战略和“互联网+”行动计划,大力发展数字经济。而城市互联网行业的发展,促进了城市间技术、人才的交流,城市互联网在空间上的关联越发紧密。在影响城市互联网行业发展的影响因素中,人力资源发挥着核心支撑作用。优秀的人力资源有助于提高经济效益,建立和完善现代企业制度。可以说,人才是互联网
学位