基于用户行为序列的推荐算法研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:victor9808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是使用用户已经存在的挑选过程或项目间相似关系,来发掘目标用户隐藏的偏好信息或物品,因此具有缓解日益严重的“信息过载”问题的能力,导致获得学术界和工业界的广泛关注并在电子商务、在线学习和数字图书馆等领域加以应用。推荐系统的核心是推荐算法,在目前流行的推荐算中,用户兴趣的预测需要大量用户评分、评论、信任值等这类明确反应用户兴趣爱好的主观性数据。但主观性数据常常比较稀疏,会制约推荐算法的推荐质量,这要求研究人员挖掘更多的用户行为中的存在的隐藏信息来优化推荐算法。本文针对用户历史行为中隐藏的上下序关系展开研究,在用户的历史行为记录中,行为与行为存在一定的关联性,本文经由提取行为间的语意关系来映射行为间的相似性。语意关系的提取采用目前自然语言处理中效果最好的Word2vec技术。Word2vec以内容语义计算行为间相似度,其中作为单词的行为内容被映射到向量空间中,并且向量之间的欧几里德距离被描述为行为之间的相似度。在基于Word2vec的项目语意特征提取中,本文提出融合内容语义和用户评分的推荐模型,在该模型中,首先收集用户的历史行为,将所有用户行为添加进空白词典来建立用户行为词典,然后由用户行为词典应用Word2vec技术获得用户行为间的相似度,由训练完成的结果预测用户的行为,应用Top-N推荐算法得出推荐项目候选列表一;紧接着选取传统协同过滤推荐算法,采用评分信息再做出预测,仍选用Top-N推荐算法得出推荐项目候选列表二,最后根据相同用户对两个候选列表取并集,得出最终的项目推荐列表。经由Word2vec还能够提取关键词间的语意关联,获得关键词间的相似性,可由用户的搜索关键词来获取用户当前需求。将上述算法在MovieLens,FilmTrust和Online_Retail数据集中与传统推荐算法进行比较,实验表明模型的推荐准确率有很大提高,并在一定程度上缓解了数据稀疏问题。
其他文献
<正>宫颈高分化绒毛管状腺癌(well-differentiated villoglandular adenocarcinoma,WDVGA)于1989年由Young和Sully首次提出,1994年被WHO列为宫颈癌组织病理学类型,是宫颈腺癌
会议
本文由美军信息化进程的特点归纳出"军队信息化"的概念和"信息化军队"的特征,进而明确我军信息化建设的目标。
恶性肿瘤是威胁人类健康和生命的顽症,近些年来在肿瘤的治疗方面虽然已经取得了长足的进步,但其治疗手段仍以化疗为主。目前化疗药物的毒副作用明显,所以新的抗肿瘤药物的开
近年来,肺癌的发病率和死亡率不断上升,由于肺癌早期无特异性症状,80%-90%就诊时已属晚期,失去了手术机会,只能接受姑息性治疗。化疗是目前非小细胞肺癌治疗的重要手段之一,
辅导员年度人物是优秀辅导员的代表,同时也代表着辅导员职业化、专业化、专家化发展的方向。通过研究辽宁省辅导员年度人物获奖事迹,并选取其中27人进行面对面的访谈,并从内
把三重积分在直角坐标系、球面坐标系、椭球坐标系、柱面坐标系和切片法等计算方法,推广到四重积分,并举例说明。
该文首先介绍了Turbo码的性能及其应用,强调了交织器对于Turbo码性能的影响,并简单叙述了交织器的原理和分类;然后设计了各种交织器并利用SIMULINK模块库建立了交织器性能仿
回归直线方程的计算能力包括根据法则公式进行准确计算,变形和数据处理,也指能根据问题的条件寻找与设计合理而简捷的运算途径.
研究目的:探讨中国省(市)区生态足迹的区域差异,为中国土地利用和规划的可持续管理提供启示和借鉴.研究方法:文献资料法和比较分析法.研究结果:分析了中国省(市)区生态足迹的
2012年3月20日,栋梁常务副市长批示:请经信委、国资委大力宣传金耀集团打造名牌产品的做法。2012年4月1日,治平副市长:把原料变成制剂,进一步拉长产品链,既有利于做大规模,又