本体驱动的中文语义检索系统的设计与实现

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:wj963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的信息组织方式以人类用户的阅读习惯进行设计,使得检索结果不能够精确定位到用户的需求,因此语义网(SemanticWeb)和本体(ontology)技术逐渐发展起来,成为当前信息检索领域研究的热点。语义网用一种机器容易处理的方式组织信息,它具备更好的灵活性、集成性、自动性和自适应性,尤其是本体技术的应用,使语义网更加智能化,在知识组织和服务中本体技术也得到了广泛的应用。围绕着语义网的建设和应用,出现了各种工具和实验性应用项目。与此同时国际语义网联盟(W3C)也推出了面向语义检索的标准查询语言SPARQL,用来完成对本体的各种检索。但SPARQL不是自然语言,需要了解本体知识库的组织方式并学会用SPARQL的语法来表达自己的查询意图,这种方式为普通用户带来了不便,为此笔者提出了一种较为理想的方式是:用户只需用自然语言来表达自己的查询意图,系统自动完成问题到SPARQL的转换和概念推理并执行相应的查询,返回查询结果。 本文首先分析了传统信息检索手段的不足,简要地介绍了语义检索的实现的背景,结合知识组织介绍了本体的概念,分析了本体的优势及SPARQL检索本体的方式。接下来,对问题进行分析和归类,提出一种中文自然语言问句到SPARQL语言的转化方案,随后,讨论了本体推理规则的描述,并利用Protege提供的推理引擎接口,调用Jess推理机完成本体概念的推理,提出了语义检索的模型和推理相关的算法,进而设计、实现了系统的语义检索和推理功能。最后通过特定的领域本体建立知识库,对系统进行测试,其查准率和查全率比传统方法有明显提高。 在本文的研究和开发过程中参照了语义网的体系构架,围绕知识服务中的各种理论和技术,综合利用了自然语言处理、本体构建、本体检索,推理技术等各方面的知识,并将这些理论通过本文提出的语义检索模型整合起来,在一定程度上解决目前信息检索系统中语义的处理不足,是语义网理念和本体应用技术在中文信息检索方面的一次有益尝试,为进一步的应用提供基础和参考。
其他文献
近年来,由于中国经济的快速发展,中国乙烯行业发展很快,但乙烯自给率仍较低。巨大的市场需求刺激了国内广泛建厂的积极性,十多个省市纷纷提出乙烯项目建设规划。面对中国乙烯行业
出版服务已经成为国外大学图书馆新的重要服务内容之一,其中“图书馆-出版社”合作模式是其重要特点.从合作对象、合作内容、合作模式及营收模式等方面对国外大学图书馆与出
分析图书馆读者培训服务的现状,针对需要改进的问题提出精细化管理;分析读者培训服务精细化管理微观上精细、宏观上系统的特征,在此基础上定将读者培训服务精细化管理的节点,
高校图书馆作为重要的信息中心,面对当前瞬息万变的信息环境,以及知识创新的新局面,如何更好地收集、整理、提供信息,并将其主动地融入到用户的环境之中,向用户提供学习、教
在综合国内学术信息检索服务的现状和现有理论方法研究的基础上,以检索词推荐为研究对象,构建基于文献特征项共现网络的学术信息检索词推荐模型.模型包括基础文献存储模块、
我国的档案学理论创新来源于档案工作实践环境的变化,而引发实践环境变化的因素之一是档案工作技术革命。在我国档案工作的漫长发展中技术革命引发的档案工作实践环境变化进
通过国外文献调研与分析,将网域资源发现服务研究归纳为7个主题,包括网域资源发现服务概念、功能、可用性、使用绩效、用户信息检索行为、对用户信息素养的影响和对图书馆与
搜索引擎是信息社会与网络环境下大众用户广泛使用的一种工具,它以其方便、快捷、易用等特性为人们普遍接受。但是信息的爆炸式增长,使得搜索引擎检准率与检全率不高、缺乏人
中国确立了走有中国特色的自主创新道路,建设创新型国家的重大战略。在加强政策研究的过程中,研究韩国的国家创新系统和创新绩效,探索韩国科技成功发展背后的原因,对我国建设创新
[目的]探究不同温度下等钳蠊螨(Blattisocius dentriticus Berlese)联苯肼酯抗性品系和敏感品系对柑橘全爪螨(Panonychus citri McGregor)的捕食能力差异.[方法]采用室内生物