基于移动定位数据的用户群体划分模型研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:lyun888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的快速发展,人们越来越多地通过移动设备上网来获取各类生活服务,这些设备记录了大量的带有时间标签的用户定位数据。由于用户的出行通常由其日常活动或兴趣所驱动,留在家里或在工作场所可以被确定为用户的日常活动,除此之外,所访问的其他地点主要受其兴趣影响,如果用户对某一地理位置的访问频次较多,则表明其对该位置的兴趣度也较高,所以通过对这些数据的挖掘可以发现用户的行为习惯和兴趣偏好。本文通过对国内外现有相关研究成果的系统梳理与分析,提出了基于移动定位数据的用户群体划分模型,将具有相似兴趣偏好的用户进行分群归类,从而可以根据群体划分的结果为用户提供基于位置的个性化服务,如位置推荐、朋友推荐、信息推送等。首先,通过对移动设备在用户上网时记录的移动定位数据进行的统计性分析,总结出移动定位数据的四个特征。其次,根据数据的时空异质性、空间聚集效应、稀疏性等特点提出了用户的“兴趣区域”(ROI)的概念,并利用基于密度的空间聚类算法对ROI进行提取。然后,利用高德地图API提取出落入每一个ROI内的所有的“兴趣点”(POI)的类别,并根据数据的语义信息不详的特性,利用TF-IDF的思想为用户的ROI构建特征向量,以此来表示其语义信息。最后,将用户对不同ROI的访问频次作为兴趣度的权重,为每个用户构建“兴趣向量”,并将余弦相似度作为用户之间相似性的度量,利用层次聚类算法将用户划分为具有层次结构的群体。基于真实的移动定位数据开展实验,利用凝聚层次聚类与K-Means对用户进行聚类分析,并将两种聚类结果进行对比。实验结果表明,两种聚类算法得到的聚类结果虽然存在一定的偏差,但是总体来看是一致的,同一用户同时被两种聚类算法划分到同一群体的概率达到85%以上,这也进一步验证了本文所提出的用户群体划分模型的可行性及有效性。
其他文献
本文针对500kV GIS断路器的两次接地故障进行对比分析,主要通过设备的电气连接情况分析、故障元件检查结果、分解产物检测及相关试验结果等比较两次故障的异同,寻找GIS断路器
晚清时期出现的尚武思潮是近代军事史上一个独特的现象。目前学术界研究已经涉及这一领域 ,并产生了一批研究成果。本文拟从整体性研究和分类性研究两个方面入手 ,对近年来学
从国家战略层面出发,李克强总理提出"互联网+"概念,教育领域应当大力推行各类互联网学习方式。目前手机APP在校园生活中的使用频率越来越高,日益成为高校学生生活的必需品之
<正>近年来,随着全面从严治党、全面依法治国深入推进,以及《党政机关厉行节约反对浪费条例》《机关事务管理条例》《公共机构节能条例》(以下称三个条例)的陆续出台,奠定了
水利工程施工技术在不断进步和发展,采用先进的技术可以提高工程的质量及效率,使得水利工程施工可以顺利完成。基于此,本文主要分析水利工程施工中的导流技术施工技术,并对这
根据现场分析实践 ,介绍了吸光光度比色分析法的系统误差和相对误差。对目前现场存在的有关问题进行了分析探讨 ,指出在汽水品质大幅度改善的情况下 ,吸光光度法在某些成分测
目的探索睡眠质量对产后疲乏程度的影响。方法以方便抽样法抽取8所医院产妇265例,采用疲乏量表、匹兹堡睡眠质量指数量表进行调查。结果产妇睡眠质量评分6.46&#177;2.51;34.7
成绩分析为教学活动提供重要的决策依据,传统的成绩分析方法难以发现教学中的潜在问题,也存在一些效率上的困难。针对传统成绩分析方法难以处理大数据成绩的问题,本文提出一
介绍了668型秸秆燃气燃烧机的基本结构以及工作原理,并对其主要技术参数进行了设计计算。
目的探讨分层级带教在儿科实习中的效果。方法根据学历层次随机将护理实习生分为观察组与对照组。观察组临床带教过程中采用层级带教,对照组则采用传统带教。观察带教结束后2