基于用户兴趣模型的个性化科研信息检索系统的研究和实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:zw9885
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前科研机构的日常办公中,对科研信息的管理是非常重要的工作。对于大量的科研信息,如何能够快速的检索到用户真正感兴趣的内容,成为近些年来学者研究的一个热点。目前,国内外各大科研期刊数据库虽然都建立了自己的检索系统,但是却无法区分不同用户之间的检索需求。不同的用户由于学历、职业、背景知识等,特别是兴趣爱好的不同,所需要的信息往往也是不同的。 本文从构建用户兴趣模型出发,结合文本分类、全文检索、检索排序和信息反馈等技术,设计了一个个性化科研信息检索方案,使用户能将精力集中于感兴趣的研究领域,从而达到为科研机构用户提供个性化科研信息检索服务的目的。 本文首先是通过研究通用搜索引擎的发展现状及其结构和技术,指出了通用搜索引擎的缺陷与发展方向;接着对已有的个性化检索技术进行改进,包括设计科研信息文本分类器,构建结果排序和用户信息反馈方案;然后研究并设计了一个基于VSM(向量空间模型)的用户兴趣模型以及用户长期兴趣和短期兴趣的相互转换与用户兴趣的更新;最后以用户兴趣模型为基础,设计了一个基于用户兴趣模型的个性化科研信息检索系统,并实现了其系统原型MySearch。
其他文献
随着多媒体技术、计算机技术,通信技术及Internet网络的飞速发展,包括图像在内的各种多媒体数据的数量正以惊人的速度增长。如何提供一个有效的算法来快速、准确的查询这些具有
在目前的加密方法中,椭圆曲线加密方法具有安全性高、密钥长度短、加密和解密速度快等优点,其必将成为当今密码学领域中最具前途的加密方法之一。从讨论信息安全需求开始,在
Ad Hoc网络是由一组带有无线收发装置的移动节点所组成的临时性多跳自治系统,在军事和民用领域具有广阔的应用前景。近年来,随着各类多媒体业务及实时业务的普及和推广,要求网络
本文从研究以电力企业为代表的电力系统信息化现状入手,详细调查了目前电力企业信息化的现实条件、系统分析了当前信息系统存在的不足以及新形势下进一步发展面临的各种困难,
生成高度真实感的虚拟自然场景一直是图形学研究领域中一个富有挑战性的难题。作为自然场景的重要组成部分,地形真实感模拟逐渐得到人们的广泛重视。本论文实现了一个三维分
由于Internet的广泛应用,基于Internet的网络战已经成为信息战的一种重要形式。为了在未来的网络战中掌握主动权,网络攻击技术是不可或缺的网络战武器,而要进行成功的网络攻击,首
数据中心已成为全球信息化建设的基础支持设施。功率供应是建造数据中心的最大限制之一,是数据中心昂贵的资源。然而部署了大量延迟敏感型应用的数据中心功率利用率低下问题一
J2EE服务架构已成为当前行业应用软件开发的主流架构,然而在实际的应用中,J2EE构架的重量级组件却给系统开发和测试带来了很大的困难,以致造成了很多项目的失败。近年来,集成了多
生物识别技术在当今世界中已经得到了广泛的应用。虹膜身份识别是一种新兴的生物身份识别技术,由于其具有唯一性、稳定性、可采集性、非侵犯性等优点而逐步受到人们的重视。与
关联规则是数据挖掘技术的一种方法,侧重于确定数据集中不同属性之间的联系,找出满足给定支持度和置信度阈值的多属性之间的依赖关系。这样的规则可以应用于商品货架设计、存货