基于移动数据的购车人群与潜在购车人群挖掘研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:qiyongde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网快速发展和在线社交网络日趋发达,新消费群体触媒习惯的不断圈层化、碎片化,使金融及汽车服务行业获客难等问题愈加严重。购车人群与潜在购车人群具有金融价值高、群体数量大及增长速度快等特点,这类人群的用户画像不论对金融业务营销还是汽车行业营销都有着重要作用。然而仅有少量机构掌握这部分信息,且由于数据不全面导致购车及潜在购车人群难以挖掘,给未掌握这类信息却有相关需求的机构带来巨大挑战。移动大数据拥有丰富的用户位置及移动互联网等数据,对于人群挖掘具有得天独厚的优势。因此,本文基于移动数据开展对购车人群与潜在购车人群挖掘的相关问题研究,实现精准的人群挖掘。购车人群挖掘方面,针对特征高维度不均衡问题引入特征分层思想,首先根据数据特性将其分为静态特征和动态特征两类,其次加入特征工程进行特征设计。针对XGBoost算法参数调优问题,利用改进的遗传算法来弥补参数寻优易陷入局部最优解等缺陷。将所得最优参数组合应用于训练模型,构建基于改进XGBoost算法的已购车人群识别模型,进而提升模型的准确度。潜在购车人群挖掘方面,利用组合赋权法进行综合评价。针对多赋权法的高运算复杂度问题,利用兼容性特点保证性能基础上减少组合权重数量。针对样本数据构造的理想点无法准确评价用户购车倾向,本文根据购车事件相关性特点,利用真实购车用户数据构造理想点,提高评价性能。在模型训练阶段,考虑样本稀疏性问题,采用半监督学习算法进行训练,达到挖潜提效目的。最后,利用测试数据集对购车人群挖掘模型以及潜在购车人群挖掘模型的性能进行验证。本文从Precision、Recall、F1-score及转化率等指标分别评估所提算法,并将其与传统算法进行对比。通过对比可知,在购车人群挖掘模型方面,本文所提特征选择方法及改进的XGBoost算法结果优于传统方法,其人群识别精确率达到91.5%。此外,在潜在购车人群挖掘方面,本文提出的组合赋权法结合半监督学习算法性能优于传统方法,其潜在购车人群挖掘精确率达到88.2%,满足模型的设计需求,具有一定的应用价值。
其他文献
如何实施财务信息化,目前的理论主要集中在ERP项目的实施,研究财务信息化的发展过程可以看出,信息化的不同阶段及其特征与IT技术的发展,软件产品的不断创新密切相关。因此,研
目的探讨健康教育分层管理在初诊2型糖尿病中的应用。方法选取2015年1月—2016年1月我院收治初诊2型糖尿病患者126例作为研究对象,将其随机均分为对照组和研究组。对照组应用
本文以建构主义学习理论为指导,阐述了如何进行网络课程的教学设计与开发工作,同时结合全国中小学教师继续教育网络课程《计算机基础》部分,从学习内容、学习情境、学习资源
目前,高校教育基金会正成为高校融资发展的一个重要渠道与发展趋势。与美国相比,我国高校教育基金会相对基础薄弱,在募捐文化背景、组织架构、资金运作机制及外在保障体系等
CCN1由381个氨基酸残基构成的4个独立结构模块,富含38个保守半胱氨酸的基质信号蛋白,近年来发现该信号蛋白在炎症反应、损伤修复、血管生成、肿瘤等多种病理生理过程中起重要
本文以旅游为视角,认为随着民俗文化游越来越成为旅游行为和旅游开发的重要内容,河池民俗文化的汉越翻译在当下具有重要的意义,并提出了河池民俗文化词汉越翻译的五种策略:音
伴随着城市人口的飞速增长,交通阻塞压力与日俱增,给普通人民群众的出行带来种种不便。如何有效缓解交通拥堵问题成为一个亟待解决的实际问题。专家、学者虽然提出了许多传统
分析了建筑工程一切险在我国建设市场发展的现状与存在的问题。从政府加强宏观调控、保险公司对自身进一步完善,以及业主、承包商加强投保意识三个方面就如何在我国建设市场健
媒介运用议程设置的"权力"所制造的性别图景从来不是一面简单地反映社会性别现实的镜子,它所设置的性别议题对于什么应该被作为"现实"而接受提供了一种常识性、必然性的释义
空管、飞行员、火车管理者和运动员等职业都会涉及到对某个或多个运动客体的运动轨迹进行预测。判断运动客体是否会发生冲突或碰撞,称为冲突探测(Conflict detection)。冲突