基于电信大数据的汽车行业用户行为的研究与应用

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:chinatobacco666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,互联网已经成为人们获取信息的主要渠道之一。与此同时,互联网在汽车行业领域的不断渗透,使得越来越多的人选择在网上搜索和浏览汽车的相关信息,这为汽车行业相关研究提供了新的数据来源。如何有效的利用海量数据对汽车行业用户进行分析具有重要研究意义。本文基于电信大数据中的汽车行业流量数据,结合机器学习方法,重点研究了汽车用户留资行为预测和汽车行业用户画像系统的设计实现。主要工作如下:1.基于电信运营商的DPI流量数据,并结合国内主流汽车网站的爬虫数据,利用分布式处理平台完成了汽车用户访问数据的预处理和分布式存储。2.针对汽车用户留资行为的预测问题,构建了用户留资行为的预测模型,提出了一种结合用户矢量表示特征和基础统计特征的特征工程方法,其中用户矢量表示利用UIB-RLW(User Interaction Behavior Representation Learning by Word2vec)方法对用户访问序列进行了表示学习。在真实汽车用户数据集上进行了实验,验证了特征工程方法的高效性,并证明了预测模型的有效性。3.设计了基于电信大数据的汽车行业用户画像系统,开发了数据可视化平台,详细阐述了用户画像标签体系的设计和获取,汽车用户群体画像的展现和查询,并完成了汽车行业洞察分析。本文提出的以UIB-RLW方法对序列数据处理并提取用户矢量特征的方法,对研究序列数据中用户的行为分析有重要的意义,针对汽车用户留资行为的预测问题,构建的用户留资行为的预测模型为有效利用用户行为数据,分析用户行为提供了新思路;设计的基于电信大数据的汽车行业用户画像系统及可视化平台为分析用户偏好,了解用户需求,洞察用户习惯提供了极大便利。
其他文献
目的:研究10%四氯化碳致大鼠慢性肝损伤中间病理变化,为建立10%四氯化碳慢性肝损伤模型提供实验依据。方法:雄性Wistar大鼠80只,随机分为正常对照组和实验组,每组动物各40只
[情节简介]1948年,印度德里,78岁高龄的圣雄甘地仍不放弃参加每日的祈祷会,他在狂热的群众簇拥下缓缓前行,周身披着的白布更衬出他脸上的庄严圣洁。突然,一个走在他近旁的陌
矿产资源是社会存在与发展永不可缺的必需品,是国民经济发展的基石。随着我国经济的快速增长,经济社会发展面临的资源约束矛盾日益明显,已经影响我国全面建设小康社会的战略
全面建成小康社会、实现中华民族伟大复兴的中国梦,全面深化改革、完善和发展中国特色社会主义制度,提高党的执政能力和执政水平,必须全面推进依法治国。依法行政与依法治国
随着信息技术的高速发展,数字化校园在高职院校信息技术的传播中起着至关重要的作用。本文将对目前高职院校数字化校园建设进程中存在的一些问题,提出个人的思考。
降钙素基因相关肽(calcitonin gene-related peptide,CGRP)是目前已知的体内作用最强的内源性舒血管活性肽。近年来CGRP已成为国内外偏头痛治疗领域的研究热点,大量文献显示
扬子地块西南缘,属华南板块南部,跨扬子陆块和南华活动带两个大地构造单元。地理范围包括贵州全境、云南东部、广西北部、湖南西部及四川与重庆南部。这一区域不仅沉积岩广布
在西部大开发的浪潮中,基础设施建设具有重要意义。本文对西部地区基础设施建设的状况及存在的问题,建设中应注意的问题以及具体措施谈谈自己的看法。 基础设施建设是西部
研制开发了一种水性路标涂料。采用特殊的水性高分子材料作乳化剂合成丙烯酸乳液树脂,并对水性高分子的羧基做特殊处理,从而使水性涂料的耐水性显著提高,采用纯丙烯酸酯聚合并适
企业翻译指涉及企业运作的一切翻译活动,一直以来为中国经济、科技等方面的发展作出不可多得的贡献,1992年10月在上海召开的首届全国大中型企业翻译研讨会,收到有关企业翻译的学