基于社会化媒体的若干兴趣点推荐关键技术研究

来源 :北京邮电大学 | 被引量 : 16次 | 上传用户:wangold
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着以Web2.0技术为基础的社会化媒体的兴起,基于位置的社交网络(LBSN,Location Based Social Network)服务、各种移动端社会化媒体的出现以及城市的快速发展,兴趣点(POI,Point-of-Interest)的数量也随之增长,人们通常喜欢探索城市与邻近的地方,根据自已的个人兴趣选择与自已偏好相关的兴趣点。基于位置的社交网络为研究人们移动行为提供了前所未有的机会,用户喜欢在这些基于位置的社交网络平台上,分享他们对各个地方的签到记录与兴趣爱好,以及他们对服务、产品的评价与体验,并且建立与维护他们的社会关系,从而展现自已的偏好与个性。这些基于位置的社交网络的创建者也更加重视对用户基础数据和行为数据进行采集、挖掘与分析,更好地理解用户的移动行为,从而更加了解他们的用户,利用兴趣点推荐改善用户体验并满足用户需求。同时社会化媒体的兴趣点推荐会面临一些新的问题:如何综合利用社会化媒体中的多样数据?如何解决用户签到数据的稀疏性?如何处理隐式的用户反馈与复杂的用户关系?如何应对用户生成内容的时效性?针对这些挑战,本文提出并设计一系列融合上下文信息的兴趣点推荐算法,提高并改善社会化媒体中的兴趣点推荐效果以及用户体验。本文创新工作如下:1.基于位置社交网络的上下文感知的兴趣点推荐。基于位置社交网络中的兴趣点签到矩阵是高稀疏的,用户兴趣随着不同时间与地理位置是动态变化的。针对此问题,本文提出一种上下文感知的概率矩阵分解兴趣点推荐算法。首先利用潜在狄利克雷分配(LDA,Latent Dirichlet Allocation)模型挖掘兴趣点相关的文本信息学习用户的兴趣话题生成兴趣相关分数;其次提出一种自适应带宽核评估方法构建地理相关性生成地理相关分数;然后通过用户社会关系的幂律分布构建社会相关性生成社会相关分数;结合用户的分类偏好与兴趣点的流行度构建分类相关性生成分类相关分数;将这四种相关分数进行分数匹配生成偏好分数;最后将其有效融合到概率矩阵分解模型(PMF, Probabilistic MatrixFactorization),生成用户感兴趣的兴趣点推荐列表。实验结果表明,该模型明显优于先进的NCPD算法,在Foursquare数据集上,准确率和召回率分别提高了 27%和24%;在Twitter数据集上,准确率和召回率分别提高了 26%和25%,显著提高了兴趣点推荐的精确度。2.基于用户签到行为的兴趣点推荐。目前缺乏一种综合分析地理影响、时间效应、社会相关性、内容信息和流行度影响这些因素共同作用的方法来处理兴趣点推荐稀疏性问题,特别是异地推荐场景。针对此问题,本文提出一种联合概率生成模型,第一个同时将上述因素进行有效融合的联合效应模型,模拟用户签到行为的决策过程,利用地理相关性设计一个良好的空间索引结构即空间金字塔,对当地偏好进行平滑优化,进一步缓解数据稀疏问题。该模型包括离线模型和在线推荐两个部分,支持本地和异地两种推荐场景,并利用一个可扩展的查询过程技术阈值算法加速在线推荐过程。实验结果表明该模型明显优于先进的SVDFeature算法,异地推荐场景中,在Foursquare数据集上,准确率和召回率分别提高了 24%和26%,在Twitter数据集上,准确率和召回率分别提高了 21%和23%,在豆瓣数据集上,准确率和召回率分别提高了 22%和24%;本地推荐场景中,在Foursquare数据集上,准确率和召回率分别提高了 14%和16%,在Twitter数据集上,准确率和召回率分别提高了 23%和20%,在豆瓣数据集上,准确率和召回率分别提高了 15%和17%,显著提高了兴趣点推荐的精确度。3.基于社会化媒体挖掘与可视化的兴趣点推荐。社会化媒体的社交网络中,图像还没有很好地被利用到兴趣点推荐研究。针对此问题,本文提出一种社会化媒体主题模型,充分利用Twitter的文本、图像、位置、时间和哈希标签这五个特征之间的内在关联性构建一个联合概率生成模型。并研究Twitter上的图像对兴趣点推荐的影响,解决噪声图像问题,预先定义三个标准:可视化一致性、可视化相关性与可视化多样性,利用卷积神经网络(CNN, Convolutional Neural Network)选择代表性的图像对兴趣点进行可视化。实验结果表明,该模型明显优于先进的TRM算法,在Twitter数据集上,平均准确率提高了 22%,显著提高了兴趣点推荐的精确度。
其他文献
<正> 喘证,是一种以呼吸急促,喘息不得卧为主要表现的疾病。它的病因病机及其治法方药,历代医家,见仁见智,各有阐述。但由于喘证多反复发作,缠绵难愈,尤其老年之人,气血亏损,
GIS强大的空间分析功能,为环境监察信息化提供了有力的工具,本文基于GIS技术的空间分析功能,提出了环境监察信息系统的总体框架,并对框架的结构、内容和应用功能做了详细的分
新课程理念下的小学硬笔书法教学,应该结合学生个体、学生群体的实际情况,认真分析现存问题,坚持以学生为本、因材施教的教学策略,关注每位学生的发展情况,制定针对性的教学
高速注塑机主要是体现在注射速率上,提高注射速率不仅能提高生产效率,还能提高制品质量,在现代注塑机的发展中占重要地位。采用蓄能器增速正是设计高速注塑机的一种方法,本文
<正>一、引言加快内部审计信息化建设是适应信息科技高速发展的必然选择,而内部审计信息化平台的建设又是内部审计信息化工作开展的基础,内部审计信息化平台建设的质量决定了
采用以人口为权数的加权变异系数对地区间财力差异进行度量可发现:对财力差异起主要作用的是财力的初次分配即财政收入,起次要作用的是财力的再分配即中央转移支付,其中,将营
在本论文中,PHB、PHBHHx和PLA分别被制作成平均粒径为160nm、250nm和150nm的微小颗粒。一种脂溶性荧光染料罗丹明B(RBITC)被包裹到纳米颗粒中,作为检测胞吞效果及缓释过程的
自20世纪末美国上市公司开始出现内部审计外部化以来,内部审计外部化就成为了学术界探讨的一个热门话题。近20年来,国内外学者从未停止关于内部审计外部化的研究与争论,不同
上世纪九十年代以来,工业化和城市化进程发展较快,但是由于长期不合理开发和利用,环境破坏问题较严重,节约资源,保护环境,发展绿色产业就成了我国发展工作的重点。其中,LED产