基于本体的语义检索技术研究

被引量 : 0次 | 上传用户:hdmlb2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息检索(Information Retrieval, IR),是从数据集中提取相关文档和信息的过程。随着数字信息量的不断增加以及用户对查询质量的要求的提高,传统的信息检索技术已经很难满足高质量的检索任务。本体作为一种论点新颖、起点较高的知识组织体系,它所涉及的相关技术对于促进信息检索技术在知识管理中发挥作用十分重要。针对目前大多数信息检索系统都是基于语法层上机械式的关键词匹配检索技术,缺乏语义处理能力,存在信息的误检、漏检等缺陷,作者在研究了信息检索技术的相关理论和本体技术的相关知识后,通过分析传统向量空间模型在语义处理方面的缺陷,本文构建了一个基于模糊本体的信息检索系统结构模型,借助于模糊本体,探讨了在检索过程中如何利用本体的领域知识实现基于概念的查询。该模型充分利用了模糊本体中隶属度的概念,对查询语句和文档关键词向量空间模型进行模糊本体概念映射,概念相似度计算。系统模型分为文档预处理和文档检索两大部分。与传统的信息检索系统结构不同的是,该模型中加入了本体服务器。在本体的帮助下,文档预处理对检索对象进行处理,建立基于概念的索引;文档检索部分的查询转换模块对用户需求进行部分的语义化处理,利用查询表达式中包含概念的上位词、下位词、同义词以及概念的义项对初始查询表达式进行了查询转换,检索代理模块利用转换后的查询表达式到信息源中进行查询。在具体的实现过程中,作者针对检索过程中的关键部分—查询扩展进行了深入的研究,并对扩展结果使用A priori算法进行修剪。文章最后利用本文研究成果实现了一个面向计算机取证领域的信息检索系统,并通过具体数值实验对该系统在查全率和查准率方面进行了性能分析,实验证明该系统具有良好的性能。
其他文献
培养初中生英语创新素养是学好英语的关键,也是学好英语的动力。在初中英语课堂教学中,教师先要为学生创造一种轻松、愉快、和谐的学习氛围,再通过激发和培养学生学习英语的
目的:观察外周血单个核细胞核因子kappaB(NF-κB)在不同病变程度的冠心病及其病程中不同时间段的表达变化,探讨NF-κB在冠心病发病中的作用。方法:选择符合冠心病纳入标准的
这是一个特定的设计体验过程,能够把出生年代作为产品消费群体的划分标准,无疑是产品开发前期研究极具意义的现象。出生于80年代后的特定群体所拥有的独特家庭身份和社会身份
本论文是以我曾经工作过的单位大连海辉科技公司为背景来写的,海辉科技公司位于大连市高新技术园区,她的前身是大连海辉科技开发有限公司,成立于1996年11月11日,由大连海事大
数字高清电视是当前世界上最先进的图像压缩编码技术和数字传输技术的结合,是高技术竞争的焦点之一。其中,信道处理系统及其相关芯片更是集中了数字信号处理、前向纠错编解码
在现代企业人力资源管理中,企业员工的频繁流动一方面使企业之间的技术交换和文化交流成为可能,另一方面给人力资源管理者在保持企业合理的员工流动率方面创造了难题。从企业
列宁是世界第一个社会主义国家的创立者,他在继承和发展马克思主义国家和法的理论基础上,从俄国的政治经济实际条件出发,阐述了一系列有关司法权的理论学说,将人类对司法权理
随着我国市场经济的进一步发展,市场已经告别了短缺经济,逐步迎来了经济过剩时期,而企业之间的竞争随着“买方市场”的形成而日趋激烈。天津百货业也正毫不例外地经历着这场
本文主要研究企业质量管理体系拓展和深化的理论和实践问题,包括大质量系统的协同、顾客价值与质量管理体系的关系、管理体系的一体化、卓越绩效与自我评估、绩效测量与平衡
目前随着人们生活水平的提高,人们外出进餐的机会增加,连云港市大多数家庭和市民选择中小型饭店作为自己日常生活中解决就餐问题的主要地点,所以此类饭店如雨后春笋般涌现出