基于ROBOT的农业信息搜索引擎设计与实现

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:HEXINLONG19871006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息资源的共享是信息社会的重要标志之一,搜索引擎是用户在Internet上检索信息的主要工具,随着搜索引擎技术的发展,智能化及专业化已成为学术界及计算机工业界的研究热点。Robot其实是一个计算机程序,也叫做Spider、WebCrawler或WebWanderer,它能自动访问Web站点,提取站点上的网页,对其进行分析处理,并根据网页中的链接进一步提取其它网页,或转移到其它站点上直至搜索完整个Internet,这个过程是自动的,不需要人工干预。 针对目前通用搜索引擎存在的搜索结果冗余信息过多,搜索结果单一,相关性小的缺点,本论文首先介绍其用Java技术实现的Robot基本原理,然后提出了一个基于Robot的农业信息搜索引擎的设计模型。在该设计模型中,采用专业站点数据库解决通用搜索引擎搜索范围过大,用专业词汇数据库、例外词汇数据库及条件优先度来进一步提高搜索结果相关性,并提出了提高搜索引擎运行速度/效率的解决办法。
其他文献
在实际开发企业级应用中,人们经常需要面对对分布式数据进行机器学习的需求。本文实现了一个集成有机器学习分布式数据功能的J2EE集成框架,在此框架结构上,能够快速、方便的开发
构件组装技术已经成为软件重用的主流技术。构件组装的目标是将分布在Internet上的构件,自动或半自动组装成为一个粒度更大的构件或者一个新的软件,缩短系统的开发周期,降低开发
工作流技术作为一种实现企业过程集成的有效手段,正在被越来越多的行业所关注,工作流系统也因而正在被越来越多的企事业单位所使用。但是目前大多数工作流系统中的流程是以列表
RSA算法现广泛应用于加密和数字签名系统。但由于对安全素数要求高,尤其要求位数大(目前要求512bit以上),实现难度大,运算时间长,在一定程度上制约了它的应用。RSA算法自提出至今
近红外光谱分析的前提是数学模型,建立一个稳定准确的数学模型是一个复杂的过程。在一台仪器上建立的模型,在其他仪器上往往不能适用,因此如何利用模型转移技术维护并充分利用已
网络的普及为社会生活带来无限便利的同时,其易攻击性也会导致不可估量的后果,如何保障网络安全已是当今开放的网络亟待解决的问题。安全协议是网络安全的有效保障手段之一,而安
制造业的规模和水平仍是衡量一个国家综合实力和现代化程度的主要标志。网络制造技术是是现代制造业的重要技术。目前,中国制造业的主要问题是从制造业大国变成制造业强国,我们
随着网络技术和网络应用的发展,网络安全问题显得越来越重要。拒绝服务攻击由于容易实施、难以防范、难以追踪等而成为最难解决的网络安全问题之一,给网络社会带来了极大的危
无线局域网(Wireless Local Area Network,WLAN)是现代无线通信技术在计算机网络中的应用,它为通信的移动化、个人化和多媒体应用提供了实现手段和技术。 无线局域网以其方
工作流的动态修改是工作流领域中最具实用价值的研究方向之一,自工作流参考模型提出以来,很多学者都在此领域提出了自己的见解和方法。对于一些业务流程根本不固定的领域,为