多信息嵌入和位置信息融合的兴趣点推荐算法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:fh2019
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的普及,GPS和Web2.0技术的发展,能够基于位置提供服务的应用程序应运而生。基于位置的社交网络(Location-based Social Network,LBSN)也变得流行起来,用户可以轻松地访问LBSN应用程序,并在自己感兴趣的兴趣点(PointofInterest,POI)留下足迹,比如用户感兴趣的餐厅、酒店、剧院等。然而,随着城市的发展,人们生活的物理边界不断被拓宽,大量的兴趣点被开发,“去哪里”变成了一个严重困扰用户的大问题。个性化POI推荐的出现,帮助用户过滤掉不感兴趣的兴趣点,减少决策时间,以提高用户的体验。
  不同于Netflix中的电影推荐,交友网站中的好友推荐,网上购物中的商品推荐,LBSN中的兴趣点推荐由于人移动的随机性,LBSN中数据的稀疏性、异构性等问题,使得兴趣点推荐具有独特的挑战性。许多学者通过利用LBSN中的好友信息、地理位置信息、签到序列信息、时间信息等来提高兴趣点推荐系统的性能,但是能综合利用多种信息来改进推荐系统性能的方法还比较少。
  为了应对上述问题,本文提出了一种多信息嵌入和位置信息融合的兴趣点推荐算法。通过利用用户好友信息、兴趣点标签信息、用户签到序列信息、地理位置信息来建立一个统一的模型EmbGeoRec进行个性化POI推荐。本文主要研究工作如下:
  (1)提出了一种基于LINE算法的图嵌入推荐算法LineRec。通过用户签到数据,用户好友数据,兴趣点的标签数据,建立三部图,即用户-好友-兴趣点图、用户-兴趣点-标签图。通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过实验,得到算法的最佳参数设定。
  (2)提出了一种多信息嵌入的联合推荐算法EmbRec。针对用户的签到信息,以及同一用户在两个连续签到的兴趣点签到的时间间隔△t,得到用户的签到序列。设计了一种基于word2vec算法的序列嵌入推荐算法SeqRec,通过序列嵌入算法,得到用户签到序列中的上下文信息,获取用户的签到规律。进而结合(1)中的图嵌入推荐算法LineRec,提出了一种多信息嵌入的联合推荐算法EmbRec进行兴趣点推荐。
  (3)通过(2)中提出的联合嵌入算法EmbRec整合用户好友信息、兴趣点标签信息、用户签到序列信息,继而添加地理位置信息来建模,充分挖掘用户的个人喜好。具体来说,通过图嵌入算法LineRec,对三部图(用户-好友-兴趣点,用户-兴趣点-标签)进行训练,整合用户好友信息和兴趣点标签信息,得到用户对兴趣点的个人兴趣和社交兴趣评分。通过序列嵌入算法SeqRec,对用户的签到序列进行训练,整合用户的签到序列信息,得到用户的签到规律。另外,用户与兴趣点之间的距离也是相当重要的,通过Naive Bayesian算法,整合地理位置信息,得到用户在某个兴趣点签到的概率,并进行打分。最后建立一个统一的模型EmbGeoRec进行个性化POI推荐。通过在两种公开的真实数据集上进行实验,结果表明,本文提出的多信息嵌入和位置信息融合的兴趣点推荐算法EmbGeoRec与其他比较流行的兴趣点推荐算法相比,具有更好的推荐效果。
  
其他文献
现代战术任务有着复杂的通信和计算需求,战术网络使用无线电台、便携式通信设备等,通过传输数据、控制命令,来完成数据收集、指挥控制等功能。随着战术网络复杂性的增加和联合作战的需求,传统的战术网络架构已难以满足需求,并饱受复杂的配置和过大的协议开销等问题。软件定义网络(SDN)作为一个新兴的,有广阔前景的思想,旨在对通信网络的架构和运行方式进行革命性的改变。但是针对资源及其管理都是分布式的战术网络,如何
随着互联网和多媒体技术的飞速发展,每天有海量的视频产生并上传到各大直播平台,如何让机器理解这类海量的多媒体内容,以此提升这些视频的智能分发效果及效率是各大直播平台面临的重要问题,视频分类是视觉理解技术中的重要组成部分,因此如何实现对视频进行精确且高效的分类是本文研究的主要内容。视频作为多媒体内容的重要组成部分,相比多媒体中的文本和音频等信息而言包含的内容更加丰富,因此本文主要以视频作为研究对象,使
学位
暴力场景检测对于网络信息净化、保护未成年人身心健康、自动视频监控等方向具有广阔的应用前景。视频和音频是媒体中主要信息,但除了视频中的暴力画面和音频中的暴力声音之外,类似愤怒或憎恨情绪的字幕出现往往伴随着暴力场景的发生。字幕文本中所包含的情绪也有很多值得参考的补充信息。尤其是在视频帧或音频帧缺失的情况下,字幕信息对于暴力场景检测有着十分重要的作用。本文对融合视听特征和字幕特征的暴力场景检测方法进行了
随着计算机和信息技术的快速发展,越来越多的用户将海量数据存放到云平台,享受云计算与深度学习技术带来的便利。然而存放于云平台上的数据涉及用户隐私,一旦遭到非法窃取,会给用户带来极大的损失和风险。针对这一问题,学者和专家们提出了基于同态加密的神经网络模型来完成云上的推理任务。用户利用同态加密技术对隐私数据完成加密并上传到云平台。云平台在不解密的前提下,对密文进行处理然后将结果以密文的形式发送给用户。然
学位
互联网中充斥着大量的恶意网页,这些恶意网页在用户不知情的情况下非法窃取用户信息,对用户的网络安全造成威胁。分析并提取恶意网页特征是基于机器学习的恶意网页识别方法的研究重点。恶意网页在URL文本、网页内容等方面与良性网页存在客观的差异,通过特征工程提取这些特征并结合机器学习分类算法,可实现对恶意网页的识别。恶意网页生存期短且攻击手段多变,存在样本收集困难的问题;同时网页样本标注的工作量大,目前还没有
随着经济全球化的日益加深,机器翻译(Machine Translation,简称MT)在许多国际舞台上扮演着不可或缺的角色,成为突破不同语言交流障碍的重要手段。在大规模语料库和计算能力有限的条件下,基于神经网络的机器翻译方法能够通过编码器-解码器架构完成源语言序列到目标语言序列的直接映射,从而获得比统计机器翻译更好的效果。然而,由于自然语言本身的复杂性和多样性,单个神经机器翻译模型的表达能力往往存
散货堆场是港口的核心资源,堆位分配是堆场资源调度中极为重要的部分。如果堆场堆位分配不合理,则极易导致堆场资源利用率低下,增加港口作业成本,降低港口吞吐量。如何进行合理的堆位分配,提高货物与堆位之间的匹配度、提高散货堆场的利用率、降低港口作业成本,已成为建设智慧港口进程中亟待解决的问题。因此,研究散货港口中散货堆场的堆位智能分配策略具有实际应用意义和一定的理论价值。针对以上问题,本文开展了相关研究,
学位
近年来,主题情感联合模型成为了无监督学习领域的一项重要研究内容,在文本主题挖掘和情感分析等方面均有实际应用。然而在现实场景中,微博本身存在文字短小,结构不完整等特征,当处理小型微博数据集时,主题情感模型的情感极性分类效果不佳。因此,本课题围绕微博主题情感模型展开研究与改进,提出基于词嵌入主题情感模型的微博情感极性分析方法,主要研究成果如下:首先,针对基于多特征融合的微博主题情感挖掘模型——TSMM
学位
本文以自然场景文档图像为研究对象,针对多变的拍摄视点引起的文档形变、文档尺度多变和复杂场景造成的文档定位错误和精确度低的问题,提出了基于角点检测的两阶段自然场景文档定位算法,通过由粗定位到精确定位的两阶段角点定位方式,实现自然场景文档的精确定位目标。本文主要工作如下:1)以CNN为算法特征提取框架,建立了粗定位-精确定位的两阶段定位算法框架。粗定位阶段以全局优化得到角点坐标近似最优解为目标,精确定
学位
随着港口运输越来越发达,为适应港口集装箱业务的发展需求,集装箱作业自动化的程度也越来越高,正确高效地识别集装箱箱号是自动化作业的基础。随着人工智能在港口领域得到广泛应用,机器学习作为人工智能的关键核心技术,受到了前所未有的重视和快速发展。基于机器学习方式识别集装箱箱号,需要足够的集装箱箱号数据集,目前在港口领域,还没有成熟的集装箱箱号数据集。因此研究集装箱箱号图像样本扩充方法对于基于机器学习的集装