基于签到数据和相似度融合的兴趣点推荐算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:liujm1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于位置的信息服务快速发展,诸如旅游景点、餐饮等兴趣点在基于位置的服务上不断积累,呈现指数级别的增长,兴趣点推荐应运而生。兴趣点推荐的任务就是帮助用户从海量级的兴趣点数据中找到符合用户偏好的兴趣点。如何利用用户历史访问信息有效地给用户偏好建模,为用户预测下一次想要访问的位置,是兴趣点推荐的研究热点。兴趣点推荐与传统的推荐相比面临更加严峻的问题,第一,用户-兴趣点的签到矩阵具有高稀疏性,仅利用签到矩阵去建模用户偏好,降低了推荐性能。第二,兴趣点的签到数据中包含很多不同类型的上下文信息,如评论、标签等文本信息,虽然评论信息可以有效的缓解签到矩阵稀疏所带来的问题,但是现有的兴趣点推荐算法中大都对评论信息没有区分,导致提取出的特征信息缺乏准确性。针对上述问题,本文提出了改进算法,具体工作如下。(1)针对用户-兴趣点签到矩阵高稀疏性问题,本文提出一种将用户的相关文本信息与签到矩阵相结合的方法来计算用户的相似度矩阵,并在推荐生成阶段提出了一种动态预测法,动态填补缺失的访问概率,进一步缓解数据稀疏,提高兴趣点的推荐性能。对于文本信息,本文利用潜在的狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型挖掘用户的兴趣主题,对用户主题特征向量进行相似性计算,然后融合签到矩阵进行相似度度量。在真实数据集上的实验结果表明,基于相似度融合和动态预测的兴趣点推荐算法有效缓解了数据稀疏性和冷启动问题,推荐性能优于传统的推荐算法。(2)针对现有兴趣点推荐算法缺乏对评论信息进行重要性划分的问题,本文提出一种基于签到数据的卷积神经网络兴趣点推荐模型。首先利用签到数据从用户专业度和信任度两个方面建立一个专家模型;其次利用专家模型对不同用户的评论信息进行分离;然后利用两个平行卷积神经网络对分离后的评论信息文档进行深层次特征挖掘,并在顶层建立共享层对两个卷积神经网络进行合并;最后将卷积神经网络模型融入到概率矩阵分解模型中进行评分预测,生成物品推荐列表进而推荐给用户。该模型在Yelp的数据集上进行实验,结果表明该算法与其他同类先进算法相比有更好的推荐效果。
其他文献
环孢素A(CsA)是一种真菌源性、含11个氨基酸的多肽类物质,其通过抑制神经钙蛋白,抑制T细胞增长与分化,达到免疫抑制作用。其作为一种强效的免疫抑制剂,临床中除了可以治疗移植
1 对象与方法1.1 观察对象试验组病例选自1998年~2000年因各种疾病来我院就诊、有与宠物(猫、狗)密切接触史,并进行弓形虫抗原抗体检测者527例.其中男186例,女341例.年龄6~84岁
新型冠状病毒(2019-nCoV)肺炎(以下简称新冠肺炎)属中医疫病范畴中的风寒湿疫,病位在肺脾,是风寒湿疫毒从口鼻侵入机体后直达肺脾,使肺脾受到损伤,表里俱伤而偏里,里有湿而表
<正>稻瘟病是全世界范围内影响水稻安全生产的主要病害之一,培育和合理利用抗病品种是控制稻瘟病危害最为经济、有效的措施。针对当前稻瘟病抗性育种存在的主要问题:兼顾叶瘟
会议
为了解我省猪旋毛虫病发展动态及上市猪肉的旋毛虫漏检情况,从食品卫生角度防治这种肉食源性寄性虫病,我们在全省进行了猪肉旋毛虫感染率和感染密度调查。本文采用目检结合镜检
针对加速试验中产品的失效机理是否发生改变的问题,基于加速因子不变原则,研究了工程上应用较为广泛的Weibull寿命分布失效机理一致性的检验方法。将Weibull分布转化为I型极
源于石油化工的塑料废弃物所造成的“白色污染”已严重影响到农业生产和生态环境,作为石化塑料的替代品,生物可降解塑料是可再生的环保产品。聚羟基丁酸酯(PHB)和蓝藻素等生物质
建库数据与制图数据的长期分离已不适应多专业领域综合应用和分析的需求,本文针对如何将建库数据和与之对应的CAD制图数据一体化整合为数字线划地图数据的问题,在阐述数据线
目的:总结一例帕金森合并骨关节病患者行全膝关节置换术的护理,针对此类患者,从相关疾病方面给予知识指导和健康内容宣教,给予患者针对性及个性化的护理措施,在一定程度上预
目的:探讨热湿化气道管理在气管插管行机械通气患者中的应用。方法:从我院选出90例机械通气患者,按照随机数字表法将患者分为对照组(n=45)和观察组(n=45),对照组实施常规气道