协同工作环境中个性化文档检索系统的研究与实现

来源 :中国科学院计算机网络信息中心 | 被引量 : 0次 | 上传用户:gaoqiongfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
虚拟实验室是一个全面支持e-Science的综合性协同工作环境,是由支持资源共享与协同工作的硬件、软件、数据、信息等资源和人员组织共同构成的有机的整体。其中,协同文档库(Colibrary,简称CLB)是其重要的核心工具集之一,负责提供文档协同部分的功能。随着信息量的增加,面对用户个性化的信息需求,传统搜索引擎日益显现其不足。如何快速的进行文档定位,使用户快捷有效地找到感兴趣的文档是CLB需要解决的一个关键问题。   本文旨在研究和实现一个个性化文档检索系统,通过收集和分析用户信息来了解用户的兴趣,为不同的用户推荐其感兴趣的文章。本文研究分析了通用搜索引擎技术和基于用户偏好的个性化搜索技术,并在此基础上,结合开源项目Lucene和实验室项目CLB,研究协同工作环境中个性化文档检索技术,从而为科研用户提供个性化的服务,使其信息需求得到最大程度和最高效的满足。   本文取得的主要成果有:提出了一种协同工作环境中个性化文档检索系统的体系结构:围绕该体系结构重点研究了用户建模技术,包括数据收集、模型表示、模型学习和模型更新等技术,并给出了各个模块的算法;并在分析和利用开源项目Lucene的基础上,结合实验室项目CLB的需求设计和实现了一个原型系统;最后通过实验证明了本文设计的个性化文档检索系统的有效性。   本文是对协同工作环境中个性化文档检索技术的一个探索,取得的成果在有关科研项目中得到初步应用,并为进一步研究基于标签搜索打下一定的基础。
其他文献
由于应用需求的驱动,以及基础科学技术、网络基础设施的快速发展,地理空间信息技术正在进入新的发展阶段。地理空间信息技术发展新阶段的特点突出表现在面向因特网和移动互联网
相比于传统同构多核处理器,异构多核处理器能够在同一个芯片上集成多个类型的处理器核以满足不同应用的资源需求,具有低功耗优势以及给定功耗约束下更高的性能潜力,近年来逐渐成
无线传感器网络可以广泛应用于大规模监测和追踪任务中,而网络自身定位是大多数应用的基础。节点必须明确自身位置才能详细说明“在什么位置发生了特定事件”。人工部署或为所
在大型集群场景的监控视频中,由于摄像头呈高远倾斜视角挂置,目标在视频中的形态信息相似,目标之间遮挡严重,传统的跟踪器很难获取单个目标的准确的、长时间的运动信息。为了能在
随着处理器进入“多核”时代,程序性能的提升已不能依赖单核性能增长,而转向程序并行性的开发。传统基于“锁”的并行编程机制因其编程困难、易死锁、扩展性差等缺点,成为并行程
以数据库管理系统为核心的现代信息系统要求具有高可靠性、稳定性和可用性等特点,这就要求数据库管理系统提供连续不间断的服务,一旦数据库服务器发生意外停机或数据丢失其损失
1999年著名的人类基因组测序计划正式启动,标志着基因组时代的序幕由此拉开。随着基因组测序的完成,揭示海量生物数据背后蕴藏的生物信息,是生物学家所面临的更大挑战。在此背景
本论文基于企业的实际产品设计,对智能手机的设计过程进行了分析和研究。基于Linux的智能手机软件平台项目是联想研究院的重点项目,其目的为统一联想高端智能手机软件平台。
如今的企业级应用开发环境中,面向对象的开发方法已经成为主流,但对象只能存在于内存中,而无法永久保留。如果要永久保存对象的状态,则需要将对象映射到关系数据库中,这个映射过程
当前,集成更多功能的系统芯片已成为国际超大规模集成电路的主流。新增和改进功能往往意味着大量的数据传输,使得I/O设备和存储器之间的数据交换成为新的瓶颈,直接存储器访问(DM