论文部分内容阅读
本文首先研究了定题搜索Robot中的一些关键技术,包括Robot爬行的原理,Robot的基本组成,机器人排斥协议,以及经典定题搜索算法与网页相关度评价,并提出了定题搜索算法的改进方案。然后将元搜索引擎技术结合到定题搜索中,充分利用各综合型搜索引擎已有的成果,使得本文的搜索过程更加有目标性,更好地保证查全率与查准率。而为了提高系统的运行效率,充分利用资源与网络带宽,本文在系统中使用了分布式的体系结构;分布式结构也更好地保证了系统的健壮性。之后,从整体上对定题搜索Robot的整体结构,工作流程以及各个功能模块的作用进行了详细的介绍。在本文的最后对所做的工作进行了详细的总结,就论文未来的研究方向进行了展望。
本文所述的系统使用Microsoft 的Visual C++语言与MFC类库实现;实现过程中使用了多线程与分布式技术,分布式各模块之间通信使用的Socket技术实现;系统运行环境是Windows2000 Server操作系统。