基于位置社交网络的用户行为建模与研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:JYCheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网的快速扩展和定位技术的日趋成熟,与位置社交网络相关的服务平台和信息被广泛应用于生活中。位置服务的广泛应用使得大量的位置数据得以积淀下来,这为挖掘位置数据背后用户的行为偏好提供了有力的支撑。通过分析用户的行为偏好,所构建的位置社交平台可以更好地便利人们的生活与出行,同时有关于用户偏好的分析结果也可以给予商家和相关行业的决策者更有益的建议和指导。因此,本文的工作重点是从现在和未来两个角度出发,挖掘和分析用户的行为偏好,从而进行兴趣点推荐和位置预测。虽然位置社交网络提供了丰富的位置数据来源,但是位置数据本身的异构性和稀疏性等特点给现有的推荐和预测方法带来了诸多挑战。针对位置数据的这一系列特点和存在的挑战,本文分别提出了相应的方法来更好地应对在推荐和预测问题建模过程中遇到的相关情况。具体来说包含以下两个方面:1.针对兴趣点推荐问题,本文构建了一个基于多源异构信息的混合兴趣点推荐模型。位置社交网络中蕴含着丰富的实体和关联关系,体现在位置数据上就是丰富的多源异构信息。通过合理的建模和算法设计来有效地整合这些信息可以改善兴趣点推荐的实际效果。针对位置社交网络中的多源异构信息,本文提出了一种基于用户虚拟兴趣和现实距离相结合的混合兴趣点推荐方法。具体来说,本文采用核密度估计的方法对地理空间距离来进行度量,使用基于好友和有共同签到地点的用户的协同过滤方法来衡量好友和兴趣相似的其他用户对于用户本身对兴趣点的心理认同度的影响,同时使用基于用户和兴趣点文本聚集的概率话题模型来挖掘用户和兴趣点的偏好,从而对用户虚拟兴趣中可解释的部分进行建模。相应的,本文使用概率隐因子模型对用户虚拟兴趣中不可解释的部分加以建模。最终本文将上述子模块有机地结合起来得到混合兴趣点推荐模型。本文在两个典型的位置数据集上进行了充分的实验,实验结果表明本文提出的混合兴趣点推荐算法优于当前已有的兴趣点推荐算法。此外,模型还具有更准确的预测性和很好的健壮性等优势。2.针对地点预测问题,本文提出了一种基于签到序列的隐话题向量位置预测模型。研究表明,位置社交网络中用户的行为偏好具有很强的规律性和可预测性,并且和用户与地点所在的情境密切相关。对于大多数用户来说,其签到记录相比于整个数据的分布而言具有很强的稀疏性。因此如何针对位置数据的上述特点构建预测模型来进行地点预测是一个亟待解决的重要问题。本文提出了一种基于签到序列的隐话题模型。具体来说,对于位置社交网络中的地理空间信息,本文采用基于区域的高斯分布模型进行建模。为了缓解社交关系稀疏性对预测结果的影响,本文对用户的社交关系进行了扩展。同时本文把基于上下文的词向量模型和基于时间的主题模型结合起来,构建隐话题向量模型来对用户签到行为的情境进行建模。对于其签到的规律性行为,本文对连续时间进行了横向与纵向的分割,把连续时间离散化。综合上述建模方法可以得到用户在不同时间模式下的兴趣偏好表示以及地点的表征向量,从而有效地预测下一时间模式下用户访问的地点。本文在典型的位置数据集上的实验结果表明与传统的地点预测方法相比,本文提出的模型具有更高的准确性。
其他文献
图像处理与识别技术是一门跨学科的前沿技术,是当今的一个热门研究领域,取得了很多的成果,并在众多领域得到了广泛应用。   本文介绍了图像处理技术的发展现状和研究意义,并介
魂芯DSP(BWDSP)是一款采用分簇体系结构,支持超长指令字运行,通过在同一时钟周期发射多条指令的数字信号处理器。分簇结构的设计提高了指令的并行性,同时保证体系结构上不会
作为计算机基础软件之一,编译器的作用至关重要。现今已经有多种相对成熟的编译器。按照生成代码所运行的目标平台划分,编译器可以分为两类,本地编译器和交叉编译器。由于嵌
由于无限传感器网络具有功耗低、成本小等特点,所以它逐渐成为了计算机科学中一个热点研究方向,并拥有广泛的应用前景。其中无线传感器网络中使用的操作系统的各项性能的优劣直
我们当前所处的时代是一个信息大爆炸的时代,由于信息技术的发展,特别是互联网的出现,产生并要处理的数据已经达到了PB(1PB=1024TB)级、EB(1EB=1024PB)级、甚至更多,这种级别
随着我国机动车占有率的迅速提高,交通事故的发生率也迅速上升,为了有效遏止交通违章行为、保障车辆行驶安全、减少交通事故的发生,人们研究开发了车辆行驶记录仪。但目前上
随着计算机仿真技术的不断发展,计算机仿真在各个行业的重要领域得到了广泛地应用,成为各种复杂大系统仿真的重要手段。随着仿真应用的不断深入,仿真规模越来越大,大规模分布
大规模群体运动现象,例如群集的鸟类等动物群体、雨雪等颗粒、细菌等微观个体,是自然界中广泛存在的现象。这类现象在许多研究领域都是人们关注的热门研究对象,例如在生物行
目前投影显示系统应用的主要限制是必须将图像投到高质量的白色影幕上。如果能把生活中随处可见的墙壁、天棚、木门、窗帘等当作影幕,将会使投影系统有更多更广泛的应用。但
作为组合优化中经典的NP-hard问题之一,旅行商问题(TSP)在实际生产中有广泛的应用,如物流路线规划、电路板印刷等。对该问题的研究不管是在实际应用中还是在科学研究中都有十