定题搜索引擎Robot中若干关键技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:FlyinginSky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先研究了定题搜索Robot中的一些关键技术,包括Robot爬行的原理,Robot的基本组成,机器人排斥协议,以及经典定题搜索算法与网页相关度评价,并提出了定题搜索算法的改进方案。然后将元搜索引擎技术结合到定题搜索中,充分利用各综合型搜索引擎已有的成果,使得本文的搜索过程更加有目标性,更好地保证查全率与查准率。而为了提高系统的运行效率,充分利用资源与网络带宽,本文在系统中使用了分布式的体系结构;分布式结构也更好地保证了系统的健壮性。之后,从整体上对定题搜索Robot的整体结构,工作流程以及各个功能模块的作用进行了详细的介绍。在本文的最后对所做的工作进行了详细的总结,就论文未来的研究方向进行了展望。 本文所述的系统使用Microsoft 的Visual C++语言与MFC类库实现;实现过程中使用了多线程与分布式技术,分布式各模块之间通信使用的Socket技术实现;系统运行环境是Windows2000 Server操作系统。
其他文献
本文主要包括四部分内容。第一部分介绍了部分计值技术的理论基础和研究现状以及应用。第二部分介绍了Java虚拟机的体系结构和Java语言部分计值研究的发展现状。第三部分是本
该论文主要阐述了:基于网络的智能化计算机辅助教学是在现代建构主义理论的指导下,将计算机技术与教育、教学改革相结合,通过教学模式的智能化、网络化设计,衍生出的一种新的
本文对安全多方计算协议进行了研究,介绍并分析了现有的四类安全多方计算协议:“基于VSS 的安全多方计算协议”、“基于Mix-Match 的安全多方计算协议”、“基于OT 的安全多方
本文提出的网络管理方法,是在认真分析、比较当前各种网络性能、故障管理技术的优缺点后,针对故障管理中故障检测、过滤和定位中需要考虑的问题,吸收了各种现有技术的优秀思想而
远程教育以网络技术为支撑,具有时空自由、资源共享、系统开放、便于协作的优点,在发展远程教育的过程中人们深刻认识到,学习资源的共享性和复用性对远程教育的实用性和经济性具
本文讨论了RKIF规范的设计和推理引擎的实现。最终定义的RKIF实际上是一个默认封闭世界假设,并去掉了一些不常用的KIF语法特性的KIF子集。在此基础上,我们以Rete算法为核心,实现
计算机通信协议的开发难度随着复杂程度的增加而日益增大,潜在错误也越来越多,其中对协议规格说明理解的偏差是重要原因之一.因此需要对协议进行一致性测试,协议的一致性测试
本文主要分为四个部分。第一部分是引言,主要讨论了在Java中引入泛型特性的原因,并概要介绍了泛型和JSR-14的一些背景知识。第二部分就主要研究了它的语法特性。该部分首先描述