基于用户个性化的检索提示系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:jiaxiaoli00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络资源的快速膨胀,在基于关键词查询的信息检索系统中,同义词多义词、查询歧义现象越来越多,检索词的选择对查询效果的影响越来越高,而广大用户往往难以选择正确的检索词,造成多次尝试检索的低效率情况。因此,传统的基于关键词搜索的检索方式已经不能满足用户高效的查询需求。在这种情况下,检索提示技术应运而生,并且在学术研究和商业应用中取得了一定突破。   CALIS中国高等教育数字图书馆统一搜索服务平台拥有海量文献数据资源,检索提示技术可以帮助用户快速找到目标文献,实现高效的检索服务。本文将传统的检索提示技术做了改进,将该技术引入数字图书馆领域,并设计和实现了检索提示系统。   不同用户往往有不同的查询需求,因此,本文用户查询日志出发,设计了支持用户个性化的检索提示方法,使用户兴趣度高的主题的检索提示词排名提前,提高了系统的查准率。该方法以查询聚类向量的形式表示用户兴趣,首先对查询日志中的查询进行聚类,通过预先对被点击文档的词频矩阵做奇异值分解并聚类,改进了现有的基于相似点击文档的查询聚类方法;再通过查询聚类结果和用户查询日志学习用户兴趣。在用户输入查询串的过程中,根据用户兴趣选择提示词返回给用户。   本文考虑了图书馆元数据中不同字段的重要性,在计算词频的过程中对不同字段的词赋以不同的权重,使数字图书馆背景下词频矩阵的计算更加合理。   此外,文本引入查询新奇度概念,在检索提示词排序过程中,将近期热门的检索提示词排名提前,使提示结果更符合用户需求。而且,本文的检索提示系统支持用户模糊查询与拼音输入,降低用户输入错误,提高了检索提示的查全率。实验证明,相比传统的检索提示方法,本文方法可以有效提高检索词提示质量,使用户的检索更有效率,用户体验更加个性化。
其他文献
随着分布式软件在电信、金融等领域的广泛应用,人们对其可用性、可靠性和安全性等可信性质给予了更高的期望和要求。为解决日益突出的分布式软件可信性问题,需对其交互行为实
无线传感器网络技术已经融入到了人民生活、生产的很多领域,它被列为21世纪最有影响的21项技术和改变世界的10大技术之一,而无线传感器网络的节点是整个传感器网络的支撑平台和
本文介绍了四种卫星导航系统:GPS、GLONASS、Galileo以及北斗,通过对几类基于四种卫星导航系统的单模、多模终端设备的分析,以及针对导弹武器系统对高可靠性授时定位设备的要求,
随着蔬菜现代化产业的快速发展,蔬菜设施栽培面积不断扩大,设施栽培面临的最大问题是连作障碍导致的土传病害等。嫁接是解决连作障碍最有效的一种可持续性生物栽培方法。目前我
车牌识别是智能交通和治安管理等各种应用中重要的组成部分,鲁棒、高效、灵活的车牌识别系统具有广泛的应用和巨大的经济价值。由于实际应用中车牌图像的多变性,车牌识别仍未
手写体字符识别是模式识别和图像处理中一个非常重要和活跃的研究领域,在信息处理领域中使用字符识别技术可以大大提高计算机的使用效率,字符自动识别是办公室自动化、新闻出版
水果机械损伤是收获机械化的主要问题,是采摘机器人系统设计与应用所面临的重大难题。至今,国内外对于水果损伤的研究主要侧重于各种受载、损伤力学与数学模型的研究,且以定性讨
奶牛生理状态监控系统是实现现代化奶牛养殖的重要工具,对提高养殖场产量,保证产品安全起着重要的作用。奶牛行为识别技术是奶牛生理状态监控系统得以实现的基础。有效地提高奶
随着互联网的发展,一种分布式架构的网络:P2P(Peer to Peer)网络成为流行的网络结构。P2P网络具有高度的动态性、自治性和异构性。用户参与网络的随机性,自愿性及用户不同的计算
基于单目视频序列的非刚性动态目标三维重建是指从摄像机获取的二维投影图像序列中恢复出目标物体在每一帧的三维表面结构,从而获得随时间变化的目标的动态模型。非刚性动态