基于用户行为分析的个人信息检索研究

来源 :第六届全国信息检索学术会议 | 被引量 : 0次 | 上传用户:hhkjtest
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个人信息检索是个人计算机上用户搜索文件的一种重要技术,但同互联网检索相比,个人信息检索能利用的信息很少,这使得个人信息检索的排序成为很困难的问题。本文通过收集计算机上的用户行为,对个人信息检索的排序问题进行深入的研究。其中用户行为分为检索系统的查询行为和计算机上的文件访问行为,本文通过查询行为获取训练数据,文件访问行为获取文件自身的权重,并利用统计学习的方法结合这两类行为学习排序函数,实验结果显示我们的方法好于传统的排序方法。另外我们实现了收集用户行为并提供多种排序函数的个人信息检索系统LUPINS。
其他文献
由于Web数据库具有自治性和异构性的特点,造成了各查询接口在内容、形式以及查询能力上都不尽相同,使得用户的查询请求受限于其给定的查询接口的表达能力,这给查询转换的准确性
会议
当前的Web服务注册架构缺少能够高效、准确、充分发现服务的分类管理机制,导致业务需求不能满足,造成服务资源浪费.针对某一特定领域,进行Web服务的分类管理显得格外重要.本
会议
企业的生存和发展必须建立在一个健康的内循环环境下,因此企业必须时刻提高经营中影响企业发展的各种风险警惕性,减少企业风险损失.而税务风险是指企业未按照国家税务政策执
近几年来,随着科学技术的不断发明与创造,社会也在不断的进步,各行各业也都在改进和完善自身的管理与经营,以适应时代前进的规律与速度.就电力行业而言,电力电网的错综复杂,
在处理非均衡文本分类问题的诸多方法中,基于数据的方法最灵活,应用也最广泛。然而,传统的基于数据的方法存在过学习、丢失有用信息及增加训练分类器时间成本等问题,本文提出一系
会议
在新的时代背景下,审计管理依托于计算机网络技术,因此其呈现出信息化和现代化的发展特征.信息化和现代化的审计方式让审计工作更加规范、科学,为电力企业发展提供更准确的审
随着生物医学文献的急剧增加,从文本中自动抽取蛋白质的相互作用关系,成为文本挖掘领域研究中的重要方向。目前主流的蛋白质关系抽取方法大多侧重于提取句子的结构化特征信息,对
会议
Blog(博客)作为一种新兴的网络媒体,在很大程度上增强了互联网的开放性,Blog 已经成为互联网上的主要信息源之一,这也使得Blog 空间中的垃圾评论成倍增长。本文首先利用处理垃圾
会议
本文主要针对基于内部控制的事业单位资产管理模式展开研究,先提出其存在不足,然后有针对性地提出几点完善措施,主要包括树立高度的资产内控管理意识、加强资产管理体系的构
blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合blog评论获取blog文章的主要内容是许多基于blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档