基于LBSN评论分析的兴趣点预测方法

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yubowen251234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交网络的不断发展,越来越多的用户利用各种社交网络来分享自己对某一事物,某一兴趣点的喜好。大量用户通过微信,Foursquare,新浪微博,大众点评等各种社交媒体对所到兴趣点进行签到、评论、分享等。与此同时智能设备的大量普及会让更多的用户通过社交应用APP签到,对其他社交用户发布的各种感兴趣的内容信息进行查看、点赞、评论等。随着用户量的增加,社交平台所存储的用户签到数据量也成指数增长,通过这些数据预测用户的下一兴趣点也越来越重要。提前对用户将要访问的兴趣点进行预测,对于用户来说不仅可以享受到越来越个性化的服务,对商家来说,也可以有针对性的服务客户,取得良好的收益。本文通过利用用户签到兴趣点的评论信息对社交网络中的兴趣点预测进行了相关研究,主要的成果如下:1.本文通过对用户签到数据的研究,提出了一种基于用户签到数据中评论信息的兴趣点预测模型。该模型首先根据用户的历史签到数据,利用张量分解提取数据集中促使用户进行该次访问的意图,接着利用时间和兴趣点特征,将每个用户的签到兴趣点进行分类。将用户的签到均分类为一个意图,然后利用隐马尔科夫模型对用户下一步签到的可能意图进行预测。同时考虑用户连续签到兴趣点间的空间距离因素,缩小预测范围;进一步考虑该意图下,将用户自身的评论信息和范围内的同样意图的兴趣点下的评论信息利用主题模型提取主题偏好,得到二者的主题词分布,利用JS距离求得两个文档间的主题相似性,得到top-k的兴趣点预测结果。实验结果表明,本论文提出的策略是有效的,提高了预测准确率和数据的可扩展性。2.为了解决兴趣点预测中数据量越来越大导致主题模型运行结果缓慢的问题,本文提出了利用spark大数据平台进行分布式计算的方法。相对于单机运算,并行化运算可以提高运行效率。
其他文献
针对传统变电站安全教育培训工作存在交互欠缺和体验性弱的问题,基于虚拟现实技术设计一种沉浸式变电站仿真培训系统方案,详细介绍系统的软硬件设计,重点介绍采用的沉浸式立
<正> 我们所说的古典文学作品是专指古代文学里的优秀作品。这些作品是现实主义的或基本上是现实主义的。是在一定程度上反映了古代劳动人民的生活、斗争、思想、感情的,是表
在经济发达地区,特别是港口地区,船舶排放的污染物占港口污染的60%以上,随着我国政府日益重视环保问题,交通部和地方政府大力推动船舶在港减排的各项政策,船舶岸电技术是船舶靠泊期
前期伦铝冲高回落,目前在低位运行区间窄幅波动。结构性过剩、行情变化小、市场变化大仍是中长期铝市的主要特征,铝价表现为贴近成本,重心缓慢上移。下半年,能对铝价起实质性
社会经济的发展推动了人们生活质量的提升,加之随着时代的发展,人们的审美理念得到巨大改变。在此背景下,人们对室内设计有了更高追求,光环境设计作为室内设计中的重要组成部
FcγRIIB作为一种抑制性受体,可介导对多种免疫细胞的负反馈调节反应,其可通过依赖或不依赖胞浆区免疫受体酪氨酸抑制基序ITIM的方式起到抑制细胞激活的作用。FcγRIIB在多种
本刊讯,据安泰科分析师何笑辉称,预计2010年国内将投产的铜粗炼和精炼产能分别为24万吨/年和69万吨/年,因此到2010年底,国内的铜粗炼和精炼产能将分别达到352万吨/年和626万吨/年。
目的:观察口服枸地氯雷他定治疗慢性荨麻疹的有效性及安全性。方法:采用随机、双盲、对照的临床研究方法,将120例慢性荨麻疹患者随机分为试验组及对照组,试验组60例予口服枸
以"中甘11"结球甘蓝初级三体为试材,结球甘蓝二倍体为对照,研究比较了其花粉生活力、花粉整齐度和花粉量。结果表明:结球甘蓝各初级三体花粉的花粉量、整齐度、生活力均低于二倍
标准耕作制度的确定是农用地分等定级的基础性工作.该文提出了标准耕作制度的定义,探讨了标准耕作制度的确定原则和确定方法,并以黄淮海为例作了实例分析.