论文部分内容阅读
目前越来越多的企业采用信息管理或知识管理系统来提高工作效率,在这样的系统中,企业员工实际在虚拟的协作环境下工作,他们需要得到与自己工作任务相关的及时有效的信息支持。传统的信息过滤技术仅根据用户的兴趣来作信息过滤和推荐,难以满足用户要求。为此,本文提出一种基于CoP(Communites of Practice)建模的信息过滤方法,并对其中关键技术进行了研究。具体研究工作包括: 针对企业协作环境下用户的信息需求,提出了基于CoP建模的信息过滤方法。在企业协作环境下,企业员工经常会面临全新的工作和任务,由于对工作的不了解,他们不能产生相关的信息需求,从而传统的信息过滤方法不能为他们的工作提供及时有效的信息推荐。CoP指为了彼此共享知识以及在工作中相互学习而建立的小组,它的兴趣是其成员任务的反映。基于已有的信息过滤研究与证据理论,本文对CoP的兴趣进行建模,得到CoP的兴趣特征,并以此为基础研究和实现了面向CoP的信息过滤技术。 提出了一种基于领域的向量空间模型。在同一个信息过滤系统中,信息、用户兴趣和CoP兴趣的表示模型应该是一致的。目前广为使用的向量空间模型直观、简明、实现方便,但只能表达用户感兴趣的关键词,而不能很好地区别用户兴趣之间的差异,并且关键词数量过多导致了算法效率降低。针对此问题,本文提出一种基于领域的向量空间模型,建立了一个领域分类模型,并给出了计算信息在各领域中权值的方法。该模型能大幅度降低维度,很好地体现用户兴趣的多样性,并且可继续采用相似性度量公式等在向量空间模型中的成熟技术。 对已有算法进行改进,提出了一种加权的星型聚类算法以学习用户的兴趣特征。CoP的兴趣特征是由其成员用户的兴趣特征融合而来,因此用户兴趣特征的获取是CoP建模的基础。用户兴趣特征的学习算法是目前信息过滤研究的热点,聚类算法综合了目前流行的两类算法Rochio和kNN的优点,但传统的聚类算法不能体现用户对文档的不同兴趣度。本文提出的加权的星型聚类算法倾向于围绕用户兴趣度高的文档来构造文档簇,从而更好地反映用户的信息需求。 本文的研究成果可为企业协作场景下的信息过滤工作提供很好的理论和应用参考。