论文部分内容阅读
随着Web2.0网站的日益发展,用户除了是网络资源的浏览者外,同时还是资源的生产者。社会标签系统是Web2.0的一个典型应用,用户主动产生标签,并通过标签标识、管理和发现信息资源。基于标签的推荐是当前标签系统的一个研究热点,旨在减轻用户负担,帮助用户选择合适的标签完成操作。 标签推荐算法是一个标签推荐流程的核心,推荐算法的好坏很大程度决定了最终的推荐质量。虽然国内外对标签推荐算法进行了一定研究,但仍存在部分问题,如不能区分标签推荐场景、推荐信息源单一、推荐集缺乏个性化等等。 为了提高用户体验性,促进标签系统进一步发展,本文对标签推荐的相关理论及技术进行了深入研究。首次提出区分标签推荐的不同应用场景:资源标注和资源搜索。然后详细分析了两种场景下用户使用标签的不同动机和需求,在此基础上提出对应的标签推荐算法p-Co-mixed和PH。p-Co-mixed算法综合了资源热门标签集、用户常用标签集以及用户历史标注行为中的标签共现性,在保证推荐集准确性的同时,提供更符合用户标注习惯的标签集;PH算法通过一个随机向量将近期流行的基于图论的Probs算法和Heats算法结合起来,并创新地用于标签推荐中。最后针对不同的标签推荐场景提出相应的评价标准,并通过在Delicious和MovieLens数据源上进行实验分析,证明本文提出的算法是可行和有效的。