论文部分内容阅读
互联网正在由于社会网络的流行,越来越多的体现出以用户为中心的特点。社会网络应用已成Web应用的主流,为人们搭建了一个Web上资源共享与交互的平台。社会网络中,用户既是数据资源的主要创建者,也是资源的传播者,资源内容由用户自生成也是社会网络的核心理念之一。因此,由用户生成内容(User Generated Content)的社会网络环境中存在数据资源过载的问题。一方面,媒体数据和用户数据都十分庞大,而且不断有新用户加入以及每天都会大量新的数据上传;另一方面,数据资源存在无序的特点,大多数资源属于无结构化数据,如视频,图片,文本日志等,这类数据都具有多语义的特点,即每个对象包含多种类别、多粒度的语义信息,社会媒体和网页一样具备海量信息的规模,但又无法直接应用现有成熟的网页信息检索技术对其进行排序,这给社会网络中的数据资源的分类以及检索带来困难。在线共享和推荐的方式成为目前社会网络环境下数据资源传播的主要途径。针对社会网络环境下资源共享效率以及推荐效率低下的问题,本研究探讨高效的资源共享与推荐的方法并能提升用户社交能力。本文的研究内容主要包含以下4个部分:(1)基于用户多维特征的变粒度分类方法社会网络以用户为中心,用户具有多特征维度的特点,特征是可用来描述用户任何性质的广泛概念,既可以是用户的个人资料,也可以是用户的兴趣爱好。从数据库角度来看,用户特征模型就是以用户为元组的用户特征项关系表,特征项就是描述用户的属性,特征是用来描述用户“属性-值”对。本文提出一种基于用户特征模型将用户从单一特征维度到多特征维度的进行变粒度分类的算法。多个用户具有相同的特征可以构成用户共同特征类,该算法能够挖掘出给定用户特征模型中满足条件的不同维度的所有用户共同特征类,特征类之间无包含关系,并且不同粒度的特征类之间建立起了层次关联。用户特征模型根据具体应用建立,算法性能和跟特征项维度,每个特征项的取值个数相关,以及用户数目等参数密切关联,本文研究分析各种参数对算法性能的影响。(2)基于用户共同偏好自动分类的高效资源共享与推荐方法在线共享和推荐是目前社会网络资源传播的主要途径,用户自建组机制的不足给社会网络中资源的共享与传播带来了阻碍,同时现有的推荐方法仅关注推荐的准确率,忽视了考虑推荐效率。本文提出了一种基于用户偏好的组自动生成方法。与用户手动创建的组进行区分,我们把本文提出的基于用户偏好的系统自动生成组称为“共同偏好组(Common Preference Group),简称为CPG”。社会网络中,用户对一个资源对象感兴趣是因为用户对媒体对象所蕴含的兴趣元素感兴趣。因此,我们把用户对许多单一资源的喜好转化为用户对兴趣元素的集合的兴趣。每个用户对每个兴趣元素都可以有自身的喜好程度,我们把同一兴趣元素上的一种喜好程度称为偏好。如果一系列用户对若干兴趣元素上的每个主题都具有相同的喜好程度,我们则称这群用户在这些兴趣元素上具有共同的偏好,我们把那些有共同偏好的用户聚集成一个组,也就是我们提到的共同偏好组。本文提出了基于共同偏好组的资源共享和推荐系统架构,然后设计实现了CPG自动生成算法,并提出了基于CPG协同兴趣发现的思想和方法,本文还研究了资源对象与CPG推荐匹配策略。(3)共同偏好组近似批量更新方法社会网络中存在海量用户,用户的注销,新用户的加入以及用户兴趣发生变化都会使得用户偏好模型发生改变。每当用户偏好模型发生改变时可以重新进行CPG挖掘算法来得到时新的CPG,但每次都对CPG重新挖掘的代价太大。本文先总结用户行为如何引起用户偏好模型的变化,并分析了用户偏好模型变化引起共同偏好CPG变化的各类情况,然后提出了共同偏好组近似批量更新方法,利用这种方法可以对CPG定时批量更新,不需要对所有用户重新挖掘,实现高效更新目标。(4)共同偏好组在Web社区管理系统中的应用社会网络中存在大量社区,并呈快速增长趋势。用户在社会网络中的行为,如上传资源,评论,讨论等等都能揭示用户的关注的兴趣元素。如何本研究探讨如何把共同偏好组方法体系运用到Web社区管理系统中,设计开发Web社区高级应用功能,如发现社区中兴趣相投的用户、协助社区组建、社区资源的多样性推荐和惊喜推荐等功能。