论文部分内容阅读
随着网页数量的激增,网上各种各样的资源让人应接不暇,如何在信息的海洋中搜索有用的信息,从而将这些隐性知识转化为显性知识为人所用已成为广大信息工作者研究的重要课题。基于搜索引擎的个性化知识推送系统(PKPS)就是为解决这一问题而提出的。个性化知识推送系统使用智能化复杂的决策与推理反馈机制,帮助用户确定信息,使用户不必再次访问固定的站点就能获取最新信息,弥补了搜索引擎及检索工具中查全率有余、查准率不足的弊端。系统智能化地理解用户的信息需求,提高用户的检索效率,从而实现真正意义上的个性化服务。
一、个性化知识推送系统的结构
PKPS的体系结构如图所示,即首先收集用户信息而后根据用户信息对用户进行建模,进而在构建的用户模型础上与搜索引擎取得数据经处理后的知识库进行匹配,最终提供个性化的服务策略和服务内容。
PKPS的知识源的获得由资源采集层、资源处理层、资源存储层和资源服务层构成,其中前三层为服务层的知识推送服务提供信息源。本系统的资源采集采用搜索引擎的核心Robot在互联网上实时爬行,实时更新数据库的信息,保证资源数据的时效性。为防止Robot的漏查,辅以手工采集,扩大数据信息的广度。资源数据采集到本地后由资源处理层对采集到的信息进行加工处理,这一过程包括对信息的分类和标引,并利用XML的优点将其转换为XML格式在资源存储层进行统一存储,将零散的隐性知识升华为系统的显性知识,放入数据库服务器中,形成PKPS的知识库。然后再通过Web Service Server、Web Server、E—Mail Server等最终提供个性化的知识推送服务。

二、用户个性化特征的获取及用户建模
所谓个性化就是信息接受者存在个性差异,包括个人学习能力、个人兴趣与习惯、个人学习基础、努力程度的差异。在平时某类信息一旦生成就是固定不变地放在那里等待信息搜取者来取,而不考虑信息的受众是谁,从而也就不用考虑信息受众的个性。个性化的知识推送系统只有获取信息受众的个性化特征才能进行个性化知识推送。目前个性化的获取主要分为两类:一是用户手工输入用户个性化特征,二是智能Agent跟踪用户行为自动获取用户的个性化特征。
一、个性化知识推送系统的结构
PKPS的体系结构如图所示,即首先收集用户信息而后根据用户信息对用户进行建模,进而在构建的用户模型础上与搜索引擎取得数据经处理后的知识库进行匹配,最终提供个性化的服务策略和服务内容。
PKPS的知识源的获得由资源采集层、资源处理层、资源存储层和资源服务层构成,其中前三层为服务层的知识推送服务提供信息源。本系统的资源采集采用搜索引擎的核心Robot在互联网上实时爬行,实时更新数据库的信息,保证资源数据的时效性。为防止Robot的漏查,辅以手工采集,扩大数据信息的广度。资源数据采集到本地后由资源处理层对采集到的信息进行加工处理,这一过程包括对信息的分类和标引,并利用XML的优点将其转换为XML格式在资源存储层进行统一存储,将零散的隐性知识升华为系统的显性知识,放入数据库服务器中,形成PKPS的知识库。然后再通过Web Service Server、Web Server、E—Mail Server等最终提供个性化的知识推送服务。

二、用户个性化特征的获取及用户建模
所谓个性化就是信息接受者存在个性差异,包括个人学习能力、个人兴趣与习惯、个人学习基础、努力程度的差异。在平时某类信息一旦生成就是固定不变地放在那里等待信息搜取者来取,而不考虑信息的受众是谁,从而也就不用考虑信息受众的个性。个性化的知识推送系统只有获取信息受众的个性化特征才能进行个性化知识推送。目前个性化的获取主要分为两类:一是用户手工输入用户个性化特征,二是智能Agent跟踪用户行为自动获取用户的个性化特征。