论文部分内容阅读
传统的用户建模方式主要是基于用户兴趣的关键词或主题标识的用户文档来构建用户模型,其存在自身的局限性:用户数据之间缺少语义和关联,无法从语义层次上揭示用户的兴趣;当新用户登录系统时,由于系统中没有或者有很少与新用户的相关数据,容易导致冷启动(coldstart)问题。随着语义网的发展,用户建模的方式逐渐向基于本体的用户语义建模方向演化。基于本体的用户模型主要是利用语义网中的概念和词汇来表示用户的特征,并通过概念的语义关系拓展用户的兴趣。近年来,关联数据特别是关联开放数据LOD云的出现,为用户语义建模开辟了新的途径。关联数据作为一个巨大的数据中心,包含大量与用户相关的数据,为解决由用户数据稀疏性造成的冷启动问题提供了很好的条件。
本文基于关联数据应用框架提出了一种利用关联数据构建用户语义模型的方法,并对该方法作了进一步的验证和评估。论文的主要内容包括以下几个方面:
(1)调研了国内外用户语义建模的主要方法和技术,通过典型实例的分析介绍,对用户语义建模的关键技术进行了比较分析。同时,总结了用户语义建模方法的优点和不足,为本文的研究提供参考借鉴的基础。
(2)讨论了关联数据背景下构建用户语义模型的基本思路和框架:首先,设计和构建符合用户需求的用户语义模型框架;其次,发现和组织与用户相关的关联数据来构造和生成用户语义模型。
(3)通过对科研领域用户进行信息分析,设计了一个基本的用户语义模型,该模型主要包括用户本体和兴趣本体。
(4)提出了基于关联数据应用框架构建用户语义模型的方法框架,并对其应用过程进行了解析。主要包括两个方面:其一,从LOD云中发现并获取与用户相关的关联数据的方法和策略;其二,利用获取的关联数据构建用户模型的基本过程,包括概念映射、同一性解析、数据聚合和模型生成几个步骤。
(5)以计算机科学中的信息系统领域为例,通过简单的个性化推荐平台对用户模型进行了验证和评估,并对用户模型的可行性和有效性进行了分析和总结。