基于语义的网络搜索查询处理和查询扩展技术研究

被引量 : 0次 | 上传用户:Jssw3_4
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对信息检索的要求越来越高,单单依靠倒排索引和词匹配技术的搜索引擎,在用户输入的查询语句普遍比较短,不能详细而准确描述查询意图的情况下,返回给用户的结果会出现错误和遗漏问题。由此,查询扩展、查询推荐等成为信息检索的研究对象和热点。不管是使用知识库还是分析语料库来获取查询扩展词的方法都有相应的缺陷,为此,本文提出了基于随机游走模型的自动查询扩展方法,同时分析了针对元搜索的自动查询扩展方法。另外,绝大部分的研究可能忽略了一个问题,就是有时候用户不知道应该输入怎样的查询语句通过搜索引擎去获取其想要的信息,很多情况发生的是搜索引擎并不能理解用户查询语句的搜索意图。为此本文提出了基于互动百科知识的语义逻辑引导的查询处理方法,充分利用三元组数据的特点来处理带语义逻辑的查询语句。本文的创新点包括:1)提出了基于互动百科知识的语义逻辑引导的查询处理方法。将互动百科网页文档上的结构化知识抽象为三类:实例、关系和术语,基于这三类知识之间的三元组关系,结合语义逻辑符号,帮助用户构造更清晰的查询语句,同时能够处理查询语句中的相似等一般搜索引擎不能处理的逻辑。在已实现的语义逻辑引导的搜索的原型系统上,通过用户参与,实验表明,使用DOM规律抓取互动百科知识的准确率达到了90%,语义逻辑引导的搜索,其Top10的文档准确性比未引导的高出6个百分点左右。2)提出了基于随机游走模型的自动查询扩展方法。结合词语之间的词汇和语义上的多种关联,包括大型通用语料库和初检Top-N文档中的词共现、同义词、语义分类树中的上下位关系。通过不同链接类型不同组合下的随机游走算法之间,以及与伪相关的局部上下文查询扩展方法的实验比较,证明了结合了四种链接类型的随机游走方法与未进行自动查询扩展的情况相比,前者的综合评估F值要比后者高出8个百分点左右,同时,与伪相关的局部上下文分析方法相比,在确保提高准确率的情况下,同时也提高了召回率,保证了信息检索整体的稳步提升,增强了自动查询扩展的鲁棒性。3)在查询多样化方面,基于互动百科海量的语义分类知识,针对模糊的查询语句,检索不同语义下的文档,对文档分类后,借助自动摘要技术,将分类摘要和分类文档可视化。从而帮助用户快速找到信息。
其他文献
ESP(English for Specific Purposes,专门用途英语)是大学英语教学改革的发展方向,同时也对学校的师资建设和教师的个人发展提出了挑战。本文从ESP课程的特殊性出发,分析了ES
目的研究探讨马钱子碱对于人单核细胞白血病THP-1细胞的生长抑制和诱导凋亡作用及其可能的作用机制。方法1.观察马钱子碱对THP-1细胞的生长抑制作用:采用CCK-8法检测不同浓度(0
在建立用模型锅炉炉内冷态气流运动 ,来模拟实际锅炉炉内没有燃烧升温状态下气流运动特性的“冷模冷”相似模型时 ,首先从描述炉内气流运动特性的微分方程出发 ,应用相似转换
<正>慢性稳定性冠心病在冠心病中占绝大多数,如何管控这一患者群体,减少他们的心血管事件发生,已成为医务工作者的重要工作。为此,中华医学会于2007年发布了关于慢性稳定性冠
甘蓝型油菜是我国最重要的油料作物,准确有效地鉴定其遗传变异对发掘优异资源,开展分子育种意义重大。本实验旨在利用SNP和SSR标记对其进行基因型分析,构建基因型数据库、开
目的:通过对某新建三级公立医院住院病历质量现状的研究,分析该医院目前住院病历缺陷情况及病历质量纳入绩效考核后的管理干预效果,查找该医院管理上的薄弱环节,提出相应的改进建议和措施。方法:对广西某新建三级公立医院2018年10月至2019年3月开业半年来的住院病历进行抽样检查,在4767份住院病历总体中,以方便抽样的方法抽取各科室约70%的住院病历3340份作为研究样本。运用文献研究法梳理政策制度及国
为了提高PWM可逆变流器电流跟踪性能 ,提出了以电流偏差微分矢量进行电流跟踪控制的新方案。当电流偏差较大时 ,选择适当的空间电压矢量 ,使其对应的电流偏差微分矢量具有与
政府作为社会公众和公共利益的代表,有责任促进公共物品的改善和公平分配,这一职能是市场机制和其它非政府组织与个人不能替代的。然而政府不是无所不能的,它不能同时满足所
为了减小瞬变电磁发射机电流脉冲关断延时、提高下降沿线性度、改善电流正负下降沿波形一致性,提出耗能型、馈能型两种准谐振型电流陡脉冲整形电路。推导关断延时、下降沿线
介绍了一种MSP430微处理器为核心的楼宇自动开窗系统。给出了主控板、分控板和电机驱动板三大功能板块的电路图,并对各个功能的具体实现进行了详细的说明。目前该系统已投入