基于自监督学习的社交网络用户轨迹预测模型

来源 :计算机应用 | 被引量 : 3次 | 上传用户:nyffyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前用户轨迹数据建模中存在的签到点稀疏性、长时间依赖性和移动模式复杂等问题,提出基于自监督学习的社交网络用户轨迹预测模型SeNext,对用户轨迹进行建模和训练来预测用户的下一个兴趣点(POI)。首先,使用数据增强的方式来丰富训练数据样本,以解决数据不足及个别用户足迹太少导致的模型泛化能力不足的问题;其次,将循环神经网络(RNN)、卷积神经网络(CNN)和注意力机制分别用于当前轨迹和历史轨迹的建模中,以此从高维稀疏的数据中提取有用的表示,用来匹配用户过去最相似的移动方式。最后,通过结合自监督学习并
其他文献
针对自然界中不同种类植物的叶片可能存在类间差异小而导致一些边缘轮廓相似的本土植物和外来入侵植物叶片识别错误的问题,提出一种PF-VGGNet模型。常用的VGGNet模型在图像分类上表现优秀,采用顺次连接的结构,可以很好地提取图像的高级语义信息特征,但一些图像浅层的轮廓和纹理特征也对分类起到关键作用。PF-VGGNet模型可以将浅层轮廓和纹理特征与网络深层高级语义信息融合,实现对植物叶片的自动识别。
针对极限学习机(ELM)中隐藏层到输出层存在误差的问题,通过分析发现误差来源于求解隐藏层输出矩阵H的Moore-Penrose广义逆矩阵H~?的过程,即矩阵H~?与单位矩阵有偏差,可根据偏差的程度来选择合适的输出矩阵H以获得较小的训练误差。根据广义逆矩阵和辅助矩阵的定义,首先确定了目标矩阵H~?H和误差指标L21范数,其次通过实验分析表明H~?H的L21范数与ELM的误差呈显著线性相关,最后通过引
针对已有差分隐私高维数据发布方法无法有效兼顾数据间复杂属性的关联关系和计算成本的问题,提出一种基于聚类分析技术的差分隐私高维数据发布方法 PrivBC。首先,基于K-means++设计属性聚类方法,引入最大信息系数量化属性间的关联关系,并对具有高度关联关系的数据属性进行聚类。其次,对聚类产生的各个数据子集进行如下操作:计算关系矩阵以缩减属性对的候选空间,并构建满足差分隐私的贝叶斯网络。最后,根据贝
在实际生活中,可以很容易地获得大量系统数据样本,却只能获得很小一部分的准确标签。为了获得更好的分类学习模型,引入半监督学习的处理方式,对基于未标注数据强化集成多样性(UDEED)算法进行改进,提出了UDEED~+——一种基于权值多样性的半监督分类算法。UDEED+主要的思路是在基学习器对未标注数据的预测分歧的基础上提出权值多样性损失,通过引入基学习器权值的余弦相似度来表示基学习器之间的分歧,并且从
信用风险是商业银行所面临的主要金融风险之一,而传统的基于统计学习的信用评分方法不能有效利用现有的特征学习方法,因此预测准确度不高。为解决这个问题,提出一种增强多维多粒度级联森林的方法建立信用评分模型,借鉴残差学习的思想,建立了多维多粒度级联残差森林(grc Forest)模型,从而大幅增加提取的特征。除此之外,使用多维多粒度的扫描尽可能多地提取原始数据的特征,从而提高了特征提取的效率。对各模型的实
图像描述任务是图像理解的一个重要分支,它不仅要求能够正确识别图像的内容,还要求能够生成在语法和语义上正确的句子。传统的基于编码器-解码器的模型不能充分利用图像特征并且解码方式单一。针对这些问题,提出一种基于注意力机制的多层次编码和解码的图像描述模型。首先使用Faster R-CNN(Faster Region-based Convolutional Neural Network)提取图像特征,然后
针对物联网(IoT)数据源的多样化、数据的非独立同分布性、边缘设备计算能力和能耗的异构性,提出一种集中学习和联邦学习共存的移动边缘计算(MEC)网络计算迁移策略。首先,建立与集中学习、联邦学习都关联的计算迁移系统模型,考虑了集中学习、联邦学习模型产生的网络传输延迟、计算延迟以及能耗;然后,以系统平均延迟为优化目标、以能耗和基于机器学习准确率的训练次数为限制条件构建面向机器学习的计算迁移优化模型。接
高速列车在运行时产生的实时监测数据通常用变长编码压缩技术进行处理,以便于传输和存储。然而这种方法会使得压缩数据内部结构复杂,导致相应的数据解压缩过程只能遵照压缩数据的组成顺序进行,效率较低。为提升高速列车监测数据的解压缩效率,借助推测技术,提出一种面向高速列车监测数据的并行解压缩算法。首先,研究高速列车监测数据的结构特征,分析影响数据划分的内部依赖;其次,利用推测技术消解内部依赖后,对数据进行试探
针对现有的入侵检测模型在未知攻击上表现不佳,且标注数据极其有限的情况,提出一种基于半监督学习(SSL)和三支决策(3WD)的入侵检测模型——SSL-3WD。SSL-3WD模型通过3WD在信息不足情况下的优秀表现来满足SSL在数据信息的充分冗余性上的假设。首先利用3WD理论对网络行为数据进行分类,而后根据分类结果选择适当的"伪标记"样本组成新的训练集以扩充原有数据集,最后重复分类过程,以得到所有对于
针对传统蚁群优化(ACO)算法搜索路径时易陷入局部最优、路径过长、转弯角度过大等问题,提出一种基于转弯角度约束的改进ACO算法。首先,增加起始点与目标点之间区域的初始信息素浓度,以避免初期盲目搜索;然后,在启发函数中加入A~*算法的估价函数和转弯角度因子,以便在下一步选择路径长度和转角次数综合最优的节点;最后,在信息素更新部分引入狼群算法的分配原则,来加强优质种群的影响力,同时借鉴最大最小蚁群(M