基于语义处理技术的信息检索模型研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户：gxp_crysta1

【摘要】

：

信息爆炸是当今信息社会的一大特点,当前信息检索技术面临着互联网网络信息更新越来越快,用户检索结果要求越来越精确的严重挑战。如何在海量的信息中有效地找到所需信息因而

【作者】

：

王瑞琴

【出处】

：

浙江大学

【发表日期】

：

2009年期

【关键词】

：

信息检索语义关联隐式反馈词义消歧查询扩展语义相关性查询优化聚类个性化推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

信息爆炸是当今信息社会的一大特点,当前信息检索技术面临着互联网网络信息更新越来越快,用户检索结果要求越来越精确的严重挑战。如何在海量的信息中有效地找到所需信息因而成为了一个关键问题,语义检索技术是解决这一问题非常有潜力的方法。然而,在语义网还没有完全实现的情况下,研究过渡时期的语义检索技术已成为近年来一个快速发展的新兴研究课题。本文对信息检索中的若干关键问题进行了研究,提出了基于语义处理技术的信息检索模型——SPTIR(Semantic Processing Technology based InformationRetrieval)。该模型围绕查询扩展和检索结果重排序而展开,主要由四个部分构成,即:基于词义消歧的语义查询扩展、基于词汇语义相关性度量的查询优化、基于文档语义相关性的检索结果重排序和语义加强的个性化信息推荐。1.在基于关键字的搜索引擎中,一个构造良好的查询是用户主观信息需求的客观表现,也是信息检索服务质量的基本保证。本文以用户查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,使用无导词义消歧的方法实现了查询关键字到本体概念的映射,基于概念词语关联进行语义查询扩展。基于词义消歧的语义查询扩展解决了传统的信息检索系统不能很好理解用户查询意图的问题。2.针对部分消歧失败的查询关键字,本文提出使用隐式反馈技术从相关文档中直接提取候选扩展查询词的策略。为了进一步精简和优化反馈产生的扩展词汇,避免查询扩展的“主题偏移”现象,本文采用基于词汇语义相关性度量的方法对扩展查询词进行过滤来优化查询。3.由于传统关键字检索返回的数据量过大,检索结果相关性评价成为研究的焦点。本文根据查询消歧的具体情况(成功、失败),提出两种文档语义相关性度量的方法:基于语义向量空间模型的文档相关性和基于词汇向量空间模型的文档相关性。根据文档相关性对检索结果进行重新排序,优先返回与查询语义相关性强的文档供用户浏览。4.本文对如何满足不同用户的个性化查询需求进行了研究,提出了一种语义加强的个性化信息推荐方法。该方法综合利用语义数据源和历史评分数据进行混合推荐,语义数据源的引入解决了传统协同过滤系统的数据稀疏性和冷启动问题。另外,为了提高推荐系统的可扩展性和实时性,在数据的离线预处理阶段,本文使用数据挖掘方法对用户和项目进行了模糊聚类。

其他文献

医用多功能鞋架的研制与应用

对于行动不便的人来说，弯腰取鞋、穿鞋、系鞋带是一件比较困难的事情，特别是年龄较大的老年病人及妊娠月份较大的孕妇。这些人穿鞋基本靠别人帮助才能完成，当旁边无人的时候，独自

期刊

鞋架多功能制作应用

某创新产业园给排水系统设计

某创新产业园建筑面积大、单体数量多、高差大且分散，地库连为一体，分期开发。本文介绍了该项目给排水各系统的设计特点，并阐述了在满足国内规范和 LEED认证要求的前提下，要严格

期刊

产业园给排水系统LEED认证

电工电子技术课程教学探讨

电工电子技术课程是工科非电类专业的一门必修课，知识面广，信息量大。教学是技校培养学生操作技能的一个重要环节，而技能的形成则是学生通过观察、模仿、实践来重复教师所演示的

期刊

电工电子技术教学设计技能训练electrical and electronic technology instructional design ski

新型城镇化与产业结构升级关系研究

新型城镇化已成为时代发展的主题。新型城镇化能否推进国民经济增长与产业结构升级是当前学术界研究的热点话题。本文通过对国内外相关文献的梳理，从理论角度总结出新型城镇化

期刊

新型城镇化产业结构升级产业集聚政策建议

哈伦热力厂建筑改造中的弹性设计研究

全球化经济带来的城市快速扩张和产业转型,频繁的经济往来和文化交融已经使得城市面貌日益趋同,失去了城市的传统印象,而象征工业时代的旧工业建筑,面临着被淘汰的窘境,城市记忆中所包含着的工业历史文化亟待表达与传承。改造更新的策略成为了既能延续城市记忆又可使旧有建筑重新焕发活力的最佳方式。但近年来旧工业建筑的改造虽已逐渐增多,却忽略了改造后的可持续再利用,没有在空间和功能使用方面留有适度的弹性。因此,旧工

学位

可持续旧工业建筑改造空间弹性设计

三大热门模式的本质

<正>商业模式正在快速迭代,如何理解共享、生态和新零售?正确解构"商业模式",有助于我们明晰新兴商业概念的本质,或者洞悉其症结所在。商业模式有多种定义,我们把商业模式定

期刊

蠕墨铸铁的机械性能应用分析研究

铸铁材料的发展及其在资源、价格、工艺性能和机械性等诸多方面的优势,铸铁材料中广泛应用的是灰铸铁。但是由于灰铸铁的金相组织、耐磨性、耐腐蚀性较差;而蠕墨铸铁除了具有

期刊

灰铸铁蠕墨铸铁机械性能应用分析gray cast iron vermlcular graphite cast iron mechanical prope

腹腔镜下治疗直肠癌术后发生吻合口瘘的危险因素及预防措施研究

目的研究腹腔镜下治疗直肠癌手术后发生吻合口瘘的危险因素进行研究,并对预防措施进行探讨. 方法以2013年1月-2015年12 月在我院就诊并进行住院治疗的直肠癌患者共78例作为

期刊

腹腔镜直肠癌吻合口瘘预防性造瘘LaparoscopyRectal cancerAnastomotic leakagePreventive stoma

历史上的加谜密信

灯谜是中国的特产,自古以来就有人利用灯谜令人费解、保密性强等特点,用于秘密通信。早在唐代,武则天当上女皇时,朝中就有人用灯谜进行秘密通信。当时,裴炎、徐敬业等不少官

期刊

徐敬业武则天卢见曾

发挥金融造血功能助力绿色食品产业链发展——以武陵山片区为例

本文基于十八大以来,习近平在长期对扶贫开发深入思考的基础上,围绕破解我国扶贫开发中的深层次矛盾和问题,发表一系列重要讲话,形成的以精准扶贫为核心的扶贫开发重要重要战

期刊

精准扶贫乡村振兴供给侧结构性改革绿色食品产业链

基于语义处理技术的信息检索模型研究

与本文相关的学术论文