论文部分内容阅读
用户兴趣模型是个性化服务的关键组成部分,旨在发现和挖掘特定个体或群体的特征信息,从而为个性化服务的展开提供信息支持和决策依据。到目前为止,全球范围内对用户兴趣的研究成果已经很多。但随着信息技术的发展,当前Web环境已发生了较大的变化,用户兴趣模型也需要改进以适应实际的需要。 在当前Web2.0环境下,随着各种Web应用的层出不穷,万维网中用户相关信息也是愈来愈多。Web已经成为一个海量的信息库,用户兴趣呈分散的状态存在于网络中的众多信息源之中。此外,随着语义Web技术的发展以及相关应用的展开,Web中的数据有着逐渐语义化的趋势。传统的用户兴趣建模方法在当前的Web环境下逐渐暴露出一些不足之处,如:没有很好的整合这些分散的兴趣,因此很难全面地描述用户兴趣;往往只关注用户的显式兴趣,对潜在的隐式兴趣发掘得还不够;多是对用户兴趣进行文本层面上的处理,缺乏语义上的分析,因此在理解兴趣之间的语义关系方面还有欠缺,尤其是对来自于不同的信息源的用户兴趣。 在这样的背景下,本文提出了基于多源兴趣融合和语义推理的方法来构建用户兴趣模型,主要研究内容如下: 1.基于多源兴趣融合和语义推理的用户兴趣建模方法的框架。本文提出了一个具体的框架和流程来描述基于多源兴趣融合和语义推理的用户兴趣建模方法的总体设计。重点阐述了信息源选择的原则、用户相关数据的获取方式、静态兴趣和动态兴趣的处理方式、用户兴趣的发掘方法等问题。 2.多源用户兴趣的融合策略。由于信息源之间的差异,不同信息源中蕴含着不同方面的用户兴趣,多源兴趣融合将使得对用户兴趣的描述更加完整。本文针对用户的静态兴趣和动态兴趣这两种不同类型的兴趣,分别提出了相应的兴趣融合策略,其中动态兴趣融合策略又包括平均融合策略和时间敏感融合策略这两种,以适应不同的需求。 3.用户显式兴趣的语义推理。为了使用户兴趣具备一定的语义以及适应更高层次上的应用,需要用知识表示的语言来描述用户兴趣。本文利用基于Web标记语言RDF的FOAF和e-FOAF:interest兴趣词汇表来表示用户兴趣并将其封装在RDF文件中,以提高用户兴趣在Web应用中的通用性。在此基础上本文借助兴趣所在领域的本体,对获得的用户显式兴趣进行语义推理,挖掘出用户的隐式兴趣。同时,通过语义推理发现了不同兴趣之间的语义关系,并对用户兴趣进行了不同粒度层次的划分,以实现对用户兴趣的多粒度描述。 本文中所提出的用户兴趣建模方法对于万维网空间中用户兴趣建模的研究和应用具有一定的参考意义。