论文部分内容阅读
随着web2.0的发展与普及,协同标注系统作为具有代表性的社会性软件逐渐进入人们视野。在系统中,用户能够使用自定义的关键词对自己喜欢的资源,例如文本,图像,音乐,网页等等进行标注,系统一方面可以存储用户的标注信息以便下次使用,一方面又可以给用户进行热门资源,潜在兴趣点等的推荐,促进用户与用户的交互。 在协同标注系统中,最基础与核心的环节是用户的标注过程,对用户标注过程的研究具有重要的实际意义。目前,学界已经开发了一些标签推荐技术用来辅助用户的标注过程。然而现有的标签推荐技术仍然存在不足:首先,传统方法只是根据资源内容产生推荐,并不能体现用户个性化的特点,其次,由于标签数据数据量大、自由度高等特点,标注系统中的评分矩阵非常稀疏,因此加入了协同过滤的推荐方法往往由于矩阵稀疏导致推荐结果不理想,或者由于标注矩阵的巨大而导致推荐算法的计算成本急剧增加。 本文提出了一种多模型个性化标签推荐方法,在已有的基于内容标签推荐方法基础上,加入了用户偏好模型,从用户标签喜好及基于项目协同过滤两个维度描述了用户的标签偏好,在保证较低的计算成本前提下,为用户进行个性化标签推荐。不仅如此,本文通过引入并改进一种SimRank算法,在一定程度上解决了评分矩阵的稀疏性问题,提高了协同过滤算法的准确度。 实验结果表明,与传统的基于内容推荐方法相比,多模型个性化标签推荐具有更好的推荐结果。它不仅降低了计算成本,而且能够挖掘用户的偏好信息,为用户进行个性化的推荐。