基于机器学习的高潜力用户挖掘算法的设计与系统构建

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:wangke777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代的潮流席卷而来,硬件设备和软件技术也飞速发展,从前在线下交易的大量数据如今已经能够存储在线上服务器中高效的进行存取处理和查询。通过及时和精确地分析大量用户基础数据和行为数据,挖掘用户行为模式得到的有用信息和知识,支撑着商业化服务的推进和完善。其中用户画像作为描绘目标用户,关联用户诉求与产品设计的重要工具,已经在各个行业和领域得到了广泛的应用,本文以网约车行业为背景,为了解决跨业务线的高潜力用户挖掘问题,针对不同业务线的用户进行画像,根据用户历史行为模式,判断未来的发展趋势。利用用户的基本信息和行为信息,抽象成特征,探索了普通的机器学习算法、深度学习与迁移学习三种模型在本问题上的表现及性能,并且结合人群画像分析系统的设计与实现,令模型产出的用户标签可以系统的、可视化的展示给公司内部成员。实验证明这几种方法可以准确的判断出高潜力用户群体,使得企业可以有针对性的做营销活动,有效地降低了推广宣传的成本,提升了投资回收率。本文主要工作内容和创新点如下:1)在XGBoost模型中,本文提出了一种利用woe值来编码非数值特征并且划分等级的特征处理方法,将稀疏且不定长的非数值特征对应到固定个数个等级中,生成新的map类型的特征,实验结果表明这种非数值特征处理方法对模型的效果有明显促进作用,且模型已上线,成为筛选高质量人群的有力工具。2)在神经网络实验中,本文利用深层神经网络(DeepNeuron Network,DNN)以及深度交叉网络(Deep&CrossNetwork,DCN)进行实验对比,不断调整网络结构以及所选取特征直至最优。3)本文采取基于特征的迁移学习方法与基于参数的迁移方法,提出迁移深度交叉网络(Transfer-Deep&CrossNetwork,TDCN),预训练几个稀疏的类别型的特征,将嵌入矩阵参数更新至最优,将权重矩阵及嵌入矩阵迁移到深度交叉网络中,分别尝试了 frozen和fine-tuning权重矩阵参数的方式进行训练,实验表明采用预训练过的特征继续微调比普通的神经网络的ROC曲线下面积(Area Under roc Curve,AUC)提高了百分之三。4)参与人群画像分析系统的设计与实现,助力精准营销与数据分析,且该系统已在公司内部成功上线。
其他文献
<正>安徽金寨农商行流程银行建设已初步形成运行高效、管理科学、规范有序的扁平化业务运行机制和管理流程,逐步建立起了适应市场需要的业务运行机制和管理模式安徽金寨农商
背景:接触有机磷化合物可导致迟发神经病的发生,然而因为迟发性神经病发生的确切机制不清楚而尚无有效的治疗方法。目的:构建磷酸三邻甲苯酯诱导鸡迟发性神经毒性模型并观察苯甲
雷电灾害对人们生产生活的影响伴随着电子高科技产业的发展日益广泛,气象行业对雷电业务需求日趋多样化,雷电信息可视化分析的研究也日益深化。WebGIS(即网络地理信息系统)是
发展高效的催化反应实现对一些重要手性药物和天然产物的绿色合成是我们课题组的研究目标.近年来,课题组针对合成化学中仍然存在的大位阻片段的构筑、官能团耐受性、以及含手
<正> 无铅保健皮蛋因不含铅毒,富含人体所需的多种氨基酸及微量元素,以其营养保健、味美可口而深受消费者的喜爱。为便于更多的农民朋友生产应用,现将无铅保健皮蛋的制作技术
腹泻性疾病、呼吸道疾病、繁殖障碍性疾病以及高热病并称为当今养猪业四大类疾病。近几年养殖户反映持续性腹泻和顽固性腹泻的现象较为严重,我们怀疑与肠道细菌混合感染以及耐
承运人迟延交付货物,是海上运输中不容忽视的问题。而关于迟延交付的界定,各国海商法的说法不一:我国《海商法》虽在第50条有所定义,但存在一定的缺憾。笔者通过一则相关案例,探讨
盛夏如何防晒伤? 首先,较为理想的方法是涂抹防晒霜。研究表明,阳光中不同波长的光具有不同的能量。紫外线波长较短,能量较高,因而对人体皮肤作用也更强烈。皮肤对波长2800~3
<正>"一年之计在于春",春季池塘冰化后,气温回升、天气持续晴朗、水温升高,鱼类摄食开始增加,抓好春季养殖生产等渔事活动,对确保全年养殖生产的顺利进行和提高全年水产养殖
改革开放以来,我国地方政府投资行为在促进经济增长和提供就业岗位方面取得了显著成效,但其中也不乏出于政绩目的乃至局部个人利益驱动的过热投资行为。自2012年中央经济工作