论文部分内容阅读
随着“以用户为中心”为主要理念的Web2.0的深入发展,Folksonomy秉承了这一重要思想因而得到广泛推广,同时也因其自由性、灵活性和共享性等特点逐渐成为当前网络最流行的应用之一。标签作为Folksonomy系统的重要产物,不仅能有效的组织、分享和检索资源,还能表示用户的偏好信息,但也存在着一些缺憾,如标签的分布稀疏性、用户标注的随意性、标签的语义模糊性等问题,都阻碍了标签在信息检索、推荐方面发挥更大的作用。近年来,通过标签来研究用户的偏好以及为用户进行个性化推荐服务已成为广大学者研究的热门方向。本文的研究工作也以标签为主要研究对象展开,主要包括以下内容:(1)提出了一种基于Folksonomy的用户动态分类思想。该方法以具有时间属性的标签为基础,通过对Folksonomy分类技术研究,本文认为带有时间属性的标签能直接动态反映用户对资源的偏好,而评论作为一种大粒度的标签则是本文的主要研究对象。首先,针对标签的数据稀疏性问题,利用评论数据的易获取性和动态性,本文通过评论进行分词,提取高频标签来表示用户的动态偏好,然后,针对标签的同义、多义及其平面性问题,对标签进行扩展,提高计算标签相似度的准确性,通过计算标签的相似性来计算评论的相似性,将评论聚类,并到映射用户类,从而将具有共同用户偏好的用户划为一组,最后通过用户在不同时间段的分组变化,获取用户偏好的转移趋势。同时也为不支持标注功能的网站改善个性化推荐服务提供了一种新思路。(2)改进了传统基于用户协同过滤的标签推荐算法。该方法针对不具有时间属性的标签展开研究改进。首先,为了减小算法的计算复杂度和缓解相似用户可能因没有使用过相同标签而不能被判定为相似用户的问题带来的影响,提出对标签进行概念分类的概念,应用标签标记度等概念对用户-标签矩阵进行过滤,然后,针对已获取数据矩阵的稀疏性问题,引入标签类别客观特征属性和用户标签偏好等概念,对用户-标签矩阵进行填充,最后,通过实验验证改进算法较传统算法能更好的提高预测推荐的准确性,改善了标签推荐质量。(3)通过原型系统验证提出的用户动态分类思想和改进的标签推荐算法的可行性。设计并实现了Folksonomy图书标签推荐原型系统,利用豆瓣开放平台,下载相关数据集,基于提出的用户动态分类方法和改进的标签推荐算法,为用户进行好友推荐和标签推荐,提高用户的个性化体验。综上所述,本文获取的相关成果在一定程度上弥补了国内Folksonomy用户偏好研究在技术实现上的缺憾,为其提供了切实可行的技术方案。