智能搜索器的概念库设计及其文档评价策略

来源 :中南大学 | 被引量 : 0次 | 上传用户:wsh2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是帮助人们从浩瀚的网络资源中获取信息的得力工具。但现阶段的搜索引擎人多基于词串匹配的全文搜索技术,理解网络信息文档的能力有限,把握用户真实查询意图的准确程度有待提高,存在着信息组织和信息搜索不够理想,网络信息获取代价高的问题。 本文在分析了搜索引擎的现状和可能的改进方案后认为实现搜索引擎的总体目标(全、准、快、省),特别是准的根本出路是搜索引擎智能化。为此,文中具体分析了搜索引擎关键部件智能搜索器(选取并组织符合要求的文档)智能化的技术构成,提出了用概念及其关联来表示和处理搜索过程中涉及到的知识的思想。 概念和概念库是网络信息搜索环境的产物,吸收了分类法和HNC、HowNet等知识系统对网络信息知识的可取之处,具有较完善的对文本文档内容的表达、文档理解和特征提取以及文档比较的能力。借助于各种模式的概念的完善组织和应刚策略,基于概念关联分析的概念运算为用户请求构思、分析和未明查询意图的猜测以及文档评价提供了强大的支持。这种概念运算能力也是达到个性化、智能化的人—机界面的基础。 文中详细讨论了概念、概念库和概念运算的模糊数学模型。在这个模型中,概念通过属性、行为和关系来表现,并以各种模糊关系相互关联,体现着不同用户和环境下对知识体系的理解。这些关联在用户背景知识学习、用户查询意图猜测以及文本内容表达、文档特征分析和评价、文档搜索和匹配中扮演着不同的角色,具有各自的应用策略。 本文最后还简要讨论了智能搜索器的实现技术,特别是人机交互技术和文档特征分析技术。几个原型实验系统的工作情况表明,这种基于概念知识的文档理解机制能有效地提高搜索引擎的工作效率,使系统具有很好的环境适应能力。
其他文献
随着网络技术、Web技术和空间数据库技术的飞速发展,WebGIS被广泛应用于各个行业.论文在国产数据库管理系统DM3的基础上建立了一个具有空间信息浏览和查询功能的WebGIS系统,
该文研究了著名的Shear-Warp方法,详细分析了Shear-Warp方法在实际绘制中出现波纹失真的原因.在实际绘制中,Shear-Warp方法经济出现严重的波纹失真.根据产生原因可将波纹失真
该文以我们课题组和天大天财公司合作开发的基于Linux的嵌入式浏览器开发为背景,对嵌入式开发的概念和嵌入式Linux做了详细的介绍,并讨论了嵌入式GUI和嵌入式浏览器的关键算
该文的研究重点在于MOLAP,主要研究MOLAP的存储与其上的几种典型操作,在分析综合多个OLAP模型的基础上,该文给出一个MOLAP模型.MOLAP较之ROLAP的不足在于存储,该文将存储压缩
当今社会处于信息时代,随着计算机互联网络的飞速发展,整个世界被越来越紧密地联系在一起。这在为人类社会带来巨大便利的同时,也产生了一系列严重的问题,信息安全就是其中突出的
目前,在我国电信网管建设中,电信管理网TMN标准已得到广泛认同,而且已经进入实施和应用阶段。然而,TMN对网络管理作出贡献的同时,TMN本身及其实现方法尚存在一些不足之处,阻碍了电
对美国国家标准技术研究所(NIST)提出的RBAC/WEB实现模型进行了研究,就角色管理工具、角色激活、与WEB服务器接口等几个方面进行了讨论.为了增强RBAC/WEB对最终用户的透明性,
手写签名鉴别是计算机安全领域中身份认证的重要技术之一.由于手写签名在个人身份表征上具有它本身特有的优势,基于手写签名的身份鉴别系统在信息交换、办公自动化、金融、军
本论文主要在两方面进行:一是对构件软件测试技术进行了深入地研究,包括单元测试、集成测试和回归测试;二是研究了构件化软件系统的测试准则,并对测试数据选择的充分性进行了分析
该文以银行信用卡交易数据为研究对象,利用数据挖掘的理论、技术和方法挖掘银行信用卡信息中的有用知识.首先介绍了数据挖掘技术的基本原理,挖掘的核心算法.结合银行领域背景