基于用户兴趣及本体术语关系的查询扩展

来源 :河北大学 | 被引量 : 0次 | 上传用户:maxchou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析传统的向量空间模型进行检索时只考虑单一查询词与文档的字符匹配、未考虑用户兴趣及文档与查询之间的语义联系等不足,将具有良好概念层次结构和对逻辑推理支持的本体引入到信息检索之中,结合用户的兴趣,提出一种基于用户兴趣及本体术语关系的查询扩展方法,目的是实现不同用户输入同一查询词可以根据其查询意图返回不同的检索结果,并从理论层面探讨了该方法的可行性与优越性。术语间本体关联度为本体里术语关联度的量化提供了统一标准,是整个方法的核心内容,也是选择扩展词的重要依据。在此基础上,本文提出了基于术语间本体关联度的引申概念及计算公式,包括术语与术语组、术语组之间、术语组与文档的本体关联度及加权本体关联度,这些引申概念是计算基于本体术语关系的查询和文档相似度的基础与保证。基于用户兴趣及本体术语关系的查询扩展方法的实现主要有六个步骤,包括计算并标注术语的兴趣权重、判断网页所属领域、统计各领域的兴趣比重、查询扩展等等。用户兴趣是个性化查询扩展方法实现的前提和基础,兴趣权重的计算是分析用户兴趣的关键因素,由术语权重、术语出现频率、网页阅读时间决定。在查询扩展中,扩展词的选择对优化检索结果有至关重要的作用,在本文中综合考虑了本体关联度、兴趣权重、领域的兴趣比重三方面因素计算扩展词的权重。实验利用查全率、查准率指标,分别在查询词为单领域和多领域两种情况下考查新方法的性能,并从两个方面与传统方法作对比。实验结果表明,本文提出的个性化查询扩展方法可以较大程度地提高检索性能,在单领域和多领域查询词集合的检索中均优于传统方法,尤其是在查询词属于多领域情况下优势更加明显。
其他文献
在上一期《新闻业务》上,林帆同志在他的《夸张与浮夸》一文中,提出在新闻的语言运用上可以采取某些“夸张”手法,并且认为只要“夸张”得当,它将不等于对事实加以歪曲的“
各地报纸关于向雷锋学习的宣传,近两个月来,逐步深入,反映了农村和各行各业开展学习雷锋的活动,介绍了学习的经验,树立起学习的典型。有些报纸针对学习雷锋活动中的一些思想
兵团房地产市场发展能够从根本上提升新疆区域住房建设效益,解决区域内住房交易问题、住房管理问题等,对改善新疆民生具有至关重要的意义。与此同时,还能够在一定程度上规范
人的正确思想从哪里来?党一再教导我们,人的正确思想,只能从社会实践中来,只能从社会的生产斗争、阶级斗争和科学实验这三项实践中来。但是人们要真正认识和解决这个问题是
近一个时期以来,陕西日报结合各地总结农村人民公社的经验的工作,宣传了有关人民公社的一系列的政策。报纸在这一时期的政策宣传当中,紧密地结合当前农村的中心工作,既全面
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
  近年来,伴随我国国民经济发展水平的逐步提高,建筑工程建设数量不断增加的同时,人们对建筑工程的质量以及施工性能提出了更高的要求。当前工程领域所存在的质量管理方法
掖县地处山东省烟台市西部,10万亩夏玉米分布在平原、涝洼、山区和丘陵等具有水浇条件的4个不同的地区。土壤水解氮70~100ppm,速效磷8~25ppm,速效钾70~100ppm。1984~1986年的10
将共生固氮植物银合欢叶作为蔗渣栽培凤尾菇的氮素添加剂,以取代基质中占10—20%的米糠,采用生料菌块或畦式栽培工艺均能获得不同程度的增产效果。试验结果显示,用20%的叶片取
在这个英雄辈出的伟大时代里,怎么样用我们的摄影机从丰富的生活中把这些英雄人物的思想面貌和劳动热情形象地、典型地、生动感人地反映出来,使照片感染力很强,既有高度的艺