论文部分内容阅读
随着Internet的迅速发展,Internet上的信息成指数增长。由于网络信息资源的飞速增加,给人们在网上寻找所需信息带来了很大的困难。搜索引擎的出现增强了人们收集和定位所需信息的能力,能够帮助人们迅速找到所需要的信息。以后的几年里搜索引擎技术开始不断的发展,Internet上的搜索引擎数量也是急剧的增加,基于Internet的搜索引擎技术成为了研究的热点。 随着搜索引擎应用的广泛化,人们对于搜索引擎的要求也越来越高,查准率和查全率成为衡量搜索引擎的新标准,无用信息的过滤成为人们开始关注的问题。如今搜索引擎不仅仅考虑能够搜索信息,还要考虑最快速的获取用户所需要的信息。除此之外,综合性的搜索引擎已经不能满足人们对于特定知识的检索要求。多元化的搜索引擎开始应运而生了,专业性和专题性的搜索引擎层出不穷,搜索引擎的发展更趋向于人性化、智能化。 本文首先回顾了搜索引擎的发展历程,介绍了搜索引擎的基本结构和实现技术。然后根据课题的研究内容和要求提出了专业性搜索引擎——生物资源专业搜索引擎的实现结构,考虑到所需要的技术,介绍了Java技术,包括特点、优势、实现技术等。之后讲解了昆虫资源检索站点和生物资源专业搜索引擎的实现细节,包括网络蜘蛛如何获取网页、中文分词模块如何工作、生物资源过滤模块如何实现、索引器如何工作以及用户接口的设计。最后对本文的工作进行总结,提出不足之处,并展望搜索引擎未来的发展。