【摘 要】
:
随着近年来智能手机的广泛使用与移动社交平台的流行,使得基于位置社交网络(Location-based Social Networks,LBSN)业务得到了快速的发展,其中包括了兴趣点(Point-of-interest,POI)推荐。POI推荐通过用户生成的签到历史,推测用户感兴趣的POI,在大量的POI候选集中个性化地预测用户下一个时刻将要访问的POI。这使得用户个性化出行体验得到了较好的提升。
论文部分内容阅读
随着近年来智能手机的广泛使用与移动社交平台的流行,使得基于位置社交网络(Location-based Social Networks,LBSN)业务得到了快速的发展,其中包括了兴趣点(Point-of-interest,POI)推荐。POI推荐通过用户生成的签到历史,推测用户感兴趣的POI,在大量的POI候选集中个性化地预测用户下一个时刻将要访问的POI。这使得用户个性化出行体验得到了较好的提升。本文主要的研究目标是基于评论信息更好地建模POI的特征和用户的兴趣,为用户提供更精准、更个性化的POI推荐列表。由于签到(check-in)数据的稀疏性,使得如何更好地融合评论信息,成为POI推荐的一个很大的挑战。现有效果最好的方法中,虽然通过分别独立建模POI序列特征和评论信息序列特征,实现POI推荐中融合评论信息的目标,然而缺乏POI信息与评论信息之间交互的过程,而且POI嵌入向量在不同上下文中缺乏动态语义表示,导致POI特征与用户兴趣特征提取不够充分。本文提出了一种分为预训练和微调两个阶段的模型架构,基于注意力机制的神经网络模型,对用户下一个时刻可能参观的POI进行预测。首先,预训练阶段,提出了基于上下文的位置嵌入模型,为目标位置自适应生成基于特定上下文的动态表达嵌入向量。同时,通过POI结合评论单词上下文训练目标向量,来获得融合评论信息的POI向量。它既可以使得嵌入向量在不同上下文中表达动态语义特征,还可以使得POI向量融合一定的语义信息。其次,微调阶段,提出了一种新颖的多因素注意力机制模块,分别捕获同一模态内序列相关性,不同模态间语义相关性,同一模态内基于语义的二阶相关性。它既能够有效实现模态间信息的同步交互,还可以实现模态内关于序列信息和语义信息相关性的自适应特征选择,使得信息特征提取更加充分。随后,通过聚合注意力机制模块聚合模态内不同因素的信息,使得模型能够在不同上下文中自适应聚合多因素信息。通过在现实世界中含有评论信息的签到数据集上的实验,本文通过对多条签到轨迹在注意力机制中的权值矩阵进行了分析,进一步证明多因素注意力机制模块在预测过程中发挥的作用。并且比较了本文的模型与其他基准模型的预测性能,最终实验结果表明,本文的预测准确度较基准模型有较大的提升,证明了该模型能够有效融合评论信息并对POI推荐问题更好地建模。
其他文献
深度估计是诸多立体视觉任务中的基础环节,在三维重建、机器人、自动驾驶等领域有较为广泛的应用。近年来,卷积神经网络的相关理论趋于成熟,在计算机视觉领域获得了瞩目成就,也为深度估计任务提供了新的解决思路。基于深度学习的深度估计任务通过理解图像的内容,对现实场景中各点的实际距离进行预测。单目深度估计受限于尺度模糊,为了提升其预测准确性,网络结构和信息线索成为解决这一任务的关键。本文从探索不同的信息线索对
在有雾天气下,空气中会存在大量悬浮粒子。来自场景的反射光穿过雾气时,会与粒子发生散射,导致反射光衰减,这种现象严重影响了后续图像处理技术的功效。在很多现实场景中都会面临此问题,所以,图像去雾是一项极具实际意义的任务。本文主要针对去雾算法中的暗通道先验算法进行研究,通过分析其存在的问题,提出改进的去雾算法,最后通过实验验证改进算法的有效性。具体研究内容分为两部分:(1)改进的天空区域分割及去雾算法。
人脸属性迁移任务作为计算机视觉领域一个重要的研究分支和人脸属性研究的基础工作,旨在精准地迁移给定人脸属性图像中的目标语义属性。近年来,深度学习的发展推动了人脸属性迁移任务的研究,现有的人脸属性迁移算法一方面通过迁移不同的人脸属性,达到了交互式娱乐的效果;另一方面通过合成更多的人脸数据,一定程度上缓解了人脸属性分析任务中数据量不足和类别失衡等问题。然而,由于复杂的面部结构和模糊的人脸属性定义,现有算
手势估计在诸多场景下都有着重要的应用,例如机器人操控抓取、虚拟现实和增强现实等。针对于空手条件下的手部检测和手势姿态估计方法已经达到了很高的精度,但是当手与被操作对象进行交互时,手部定位及手势估计效果并不令人满意。造成性能不佳的原因主要有物体遮挡因素的干扰以及人手姿态的多样性和不确定性。针对这些问题,本文提出了手物交互场景下基于深度学习的手部二维检测和手部三维关节点定位的方法,并在对应的数据集上取
教育直播是一种新兴的教学模式,依托于互联网直播技术的飞速发展,让教学课堂不再拘泥于地点的限制,教师可以使用教育直播系统将教学信息实时地传递到多个学生的终端设备上,实现随时、随地的授课。现今市场上教育直播平台种类繁多,但存在着安全性、私密性、体验感受、适用性等方面的问题。针对上述情况,本论文在深入研究直播技术的基础上,根据教学课堂的实际应用需求,设计了一种基于FFMpeg的教育直播系统。该系统划分为
基于视觉的手部3D姿态估计及形状重建是实现人机交互的重要环节,在虚拟现实、智能机器人等领域具有广泛应用。近年来,深度学习和神经网络的迅猛发展为计算机视觉提供了强大的技术支持,涌现了大量优秀的基于视觉的手部姿态估计和形状重建方法。尽管这些方法已经取得了喜人的成绩,但RGB图像存在诸如背景复杂、深度信息缺乏等问题,导致姿态估计的精度及形状重建的效果仍有提升的空间。针对以上问题,本文给出一种基于单张RG
图像生成,旨在使用机器学习或者深度学习方法生成满足用户需要的虚拟图像。目前主流的图像生成算法多数是文本到图像的生成,这类算法在简单语义结构下通常具备较好的表现能力。但是当文本描述中的语义结构较为复杂时,例如对象数量多,对象之间关系复杂等情况,生成的图像中对象轮廓不清晰,边界模糊,图像质量低。后续有工作为解决上述问题,提出了场景图到图像的生成模型,以图结构的数据作为输入,通过挖掘场景图中复杂的语义结
近年来,随着计算机大规模计算能力的提升和信息化时代的到来,人们对虚拟现实、增强现实、机器人操作等方面的需求提高,其中3D手部姿态估计发挥着重要作用。随着商用相机的普及和人工智能的快速发展,基于视觉的3D手部姿态与形状估计的研究越发深入,提出了许多手部姿态与形状估计方法,用于从图像输入中估计手部的3D姿态与形状。尽管这些方法取得了显著的进展,但在精度及姿态还原度方面还有待改善,尚需进行进一步的深入研
近年来,中国各级检察院、法院不断推动智慧司法建设,扩大司法领域信息化应用范围。同时,与日俱增的海量文书处理工作也对相关司法部门的信息系统提出了挑战。文本自动摘要是自然语言处理的一项重要任务和研究热点,目的是让机器能够自动地完成信息的选择、压缩以及抽象,并输出被人类所能理解的文本。文本自动摘要能够提高信息获取效率,和具体业务流程相结合,可以减轻用户的工作负担。因此,面向法律文本的摘要算法和应用研究,
近年来,随着全球定位技术和无线通信网络的快速发展,轨迹数据更易于被采集与使用,为城市交通规划、出行规律挖掘、兴趣点推荐等应用提供重要价值。但是,由于轨迹数据具有数据规模大、异频采样性、数据质量差等特性,直接影响了轨迹数据的挖掘效果和计算效率。为此,大规模轨迹数据的分析与处理一直属于学术界和工业界关注的焦点。在大规模轨迹数据的分析与处理中,轨迹相似性查询一直属于关键操作之一,是实现移动行为规律挖掘、