基于语义查询扩展的信息检索研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:nhybgt12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的发展和万维网上信息资源的激增,万维网成为人们获取知识的主要来源,信息检索越来越受到人们的关注。传统的信息检索技术一般集中在关键字匹配方面,它不能对万维网上的信息提供语义级的组织、理解和处理等更能满足用户需求的服务,因此虽然有较高的查全率,但查准率得不到保障,于是寻找新的方法成为目前信息检索研究的热点。语义web的提出和发展为语义信息检索的实现开辟了一条崭新的思路。语义web层次结构中的本体,是一种用来描述概念以及概念和概念之间关系的模型,它由于具有良好的层次结构和支持逻辑推理功能而被广泛应用于语义信息检索技术中。本文在现有语义检索方法的基础上,针对基于本体的语义信息检索进行了的研究,以领域本体为语义处理的基础,给出一个语义检索模型,并对检索模型涉及的文档预处理,用户查询扩展等方面进行了分析和研究。  本文在分析了传统信息检索方法的不足和信息检索技术的研究现状的基础上,首先简要介绍了语义信息检索的背景――语义web;然后详细介绍了语义web结构中的本体层,阐述了本体的起源、分类、描述语言、建模理论以及构建工具;接着对语义信息检索模型中文档预处理和查询扩展两个关键模块进行详细分析,首先利用向量空间模型表示初始文档集的语义向量,并利用K近邻算法对初始文档集进行分类,将其分为若干个类簇,从而缩小查询时的检索范围,提高检索效率,其次介绍了查询扩展技术的研究现状和常用方法,并结合本体提出一种综合的用户查询扩展方法;最后构建一个关于计算机科学的领域本体,利用lucene对检索模型进行实验验证,给出检索结果并对结果进行分析。
其他文献
现如今恶意代码数量以爆炸式的速度增长、复杂度和破坏力不断增强、恶意代码技术创新越来越频繁,使得传统的以人为监控资源操作的恶意代码分类越来越困难,能够自动化分析、高效
PaaS云作为一种重要的云计算模式,通常以可编程容器的形式交付一组软件和基础设施供云租户开发、托管及部署应用程序或服务。PaaS平台自身负责维护资源的动态扩展,可极大降低应
在移动通讯市场经过多年大规模网络建设、终端高度普及之后,移动运营商眼下都将精力集中于对现有网络整合、业务模式创新、服务质量提高和开拓新的用户市场上,以期实现快速的
近年来随着深度学习方法的发展以及GPGPU大规模并行计算技术的成熟,深度学习在学术界和工业界得到了广泛应用,2012年深度学习相继在图像分类和语音识别领域取得了突破性成果。
网格将用通信手段连接起来的资源无缝集成为一个有机的整体。它给用户提供一种基于国际互联网的新型计算平台,在这个平台上对来自客户的请求和提供资源的能力之间进行合理的
随着我国经济不断发展,信用贷款市场不断扩大,大量信用贷款平台应运而生,越来越多的小微企业及个体商户需要通过互联网信用贷款平台申请贷款满足其资金需求。由此信用贷款风险控制成为信用贷款行业的热门研究领域,信用贷款风险控制领域的主要研究问题之一是信用风险分类问题。随着机器学习方法在信用贷款风险控制领域应用日渐成熟,大量的信贷风控问题已经从原来的人工审核或者统计学习解决方式转由计算智能解决方式。使用计算智
学位
随着现代社会对无线移动网络的需求迅速增长,基于无固定基础设施的、自组织、自适应的移动AdHoc网络在军事和民用上得到了快速发展,人们对其研究也持续升温。其中,AdHoc网络路由
近年来,移动互联网发展迅速,基于智能手机的应用越来越丰富,以智能手机为计算中心的移动医疗也依托这一势头发展迅猛。另一方面,我国人口结构进入了快速老龄化的阶段,心脑血管疾病
在目前的残疾人高等教育中,针对听障学生开展的计算机编程语言的教学存在许多难点。由于施教学生的特殊性——听力障碍所造成的沟通困难,常规的教学方式在听障学生教学中无法使
从Web中抽取和聚合对象信息对于Web数据处理意义重大,因为通常同一类型的对象分布于不同的Web资源中,而这些资源的结构特征迥异,现有的Web信息抽取技术往往无法较好地完成Web