设计和实现一个主题搜索引擎

来源 :内蒙古大学 | 被引量 : 5次 | 上传用户:jiangchong122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
今天,在Web信息资源极大丰富的同时,对Web信息搜索工具的研究也提出了更高的要求。由于目前Web的规模和它的动态性,通用搜索引擎仅能爬行和索引Web的一部分。因此,通用搜索引擎已经很难再为用户提供一个全面的并且更新及时的信息搜索服务。通用搜索引擎的局限性来源于它试图索引全部Web并且试图服务于涉及所有主题的查询请求。而主题搜索引擎只覆盖与某一主题相关的Web区域,这样,它爬行的可以更深,爬行的周期可以更短,因此可以满足用户对获取信息资源的快速、准确和全面的要求。为了有效定位与主题高度相关的网页,主题搜索引擎利用丰富的上下文(兴趣剖析文件和网页内容)和有效的爬行策略来导航Web上的信息搜索。目前,对主题搜索引擎的研究正处于十分活跃的阶段。许多机器学习领域里的知识被应用到主题搜索引擎的设计和实现中。 本文作者广泛阅读和研究了国际上最近几年发表的有关“主题搜索引擎”的论文及资料,对目前主题搜索引擎的研究及应用状况有了一定程度的认识。在此认识的基础上,本文确立了两个目的,一个目的是对有关文献中给出的重要而富有创新的研究成果做一个比较详细的介绍,另一个重要的目的就是设计和实现一个主题搜索引擎原型,从而借助这个原型可以验证我们自己或其他研究人员在搜索策略上的一些想法及它们的应用价值。
其他文献
数控切削参数是数控加工中的核心要素之一,直接影响着数控加工技术水平和生产效率。长期以来,数控切削参数的处理一直是制约数控技术的主要瓶颈,采用软件技术解决数控切削参
本论文描述了一种方兴未艾的高可靠性的网络安全技术,它利用多因素的强身份认证技术,结合角色授权及访问控制共同来保护企业的重要资源,介绍了多因素强身份认证技术产生的背景及
学位
随着互联网的发展,当今互联网上的信息量已经十分庞大。从这些数据中构建机器可读的知识库,包括世界上所有的实体、及它们精确的语义信息和关系成为非常重要的问题。类似维基百
随着科学技术的发展,信息技术的进步,现代生活已经进入了信息时代。人们对各种信息的需求越来越强烈。广播电视作为现代的主流传播媒体,如何在信息时代满足观众掌握信息的要求,成
网络教育资源种类繁多,形态各异.如何有效整合网络教育资源以使其为教学所用,已经成为远程教育研究领域的一个重要课题.本文从网络教育资源分布特点出发,通过分析网络教育资
学位
分组密码是现代密码体制发展的两个方向之一,它具有速度快、易于标准化和便于软硬件实现等特点,通常是信息与网络安全中实现数据、数字签名、认证和密钥管理的核心体制,因此分组
学位
存储区域网(StorageAreaNetwork,SAN)为满足日益增长的数据存储需求提供了坚实的基础,但与传统网络相比,存储区域网的构成和管理更加复杂,因此必须提供高效的网络管理方案,才能充