分布式搜索引擎设计与实现

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：harryleexxx

【摘要】

：

本文对分布式搜索引擎设计与实现进行了研究。文章实现了互联网搜索引擎中的核心功能，完成了一个基本的面向大规模互联网的分布式搜索引擎平台。在分布式爬虫子系统中，多个爬虫

【作者】

：

李伟

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2006年期

【关键词】

：

互联网络搜索引擎网络爬虫分布式系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文对分布式搜索引擎设计与实现进行了研究。文章实现了互联网搜索引擎中的核心功能，完成了一个基本的面向大规模互联网的分布式搜索引擎平台。在分布式爬虫子系统中，多个爬虫应该避免重复爬行，按照URL的Hash值为每个爬虫分配一个URL空间，互不重叠，并通过调整爬虫爬行的URL空间来进行负载均衡。另外，本文实现的爬虫系统可以同时支持IPv4和IPv6网络。存储子系统由若干个存储组构成，每个存储组存储互不重叠的一个URL空间的Web对象，由主服务器发布这一存储策略。

其他文献

在体生物光学成像前向及逆向问题研究

自从X射线发明以来，医学影像技术的发展大概经历了三个阶段：结构成像、功能成像和分子影像。医学影像技术(包括结构成像和功能成像)和现代医学影像设备(如：计算机断层成像CT、核

学位

生物光学成像漫射方程网格化简光学仿真算法平台生物组织

基于嵌入式的模糊PID温控系统的研究

温度是工业生产中常见的物理量，温度控制的好坏有时会直接影响到工业产品的质量。电阻炉是工业生产中重要的加热设备，如何利用自动控制系统有效的控制电阻炉的温度，以便提高产品

学位

PID控制电阻炉嵌入式控制温度控制

粗糙集理论在锅炉燃烧诊断中的应用

我国日益严格的环境保护标准要求减少电站锅炉的燃烧污染排放，而优化锅炉炉内燃烧工况不仅是控制燃烧污染排放的有效途径，而且能减少燃料量和避免炉内爆管事故，从而能提高电站锅

学位

图像处理粗糙集燃烧诊断

平面交叉口混合交通流机非干扰微观行为模型研究

混合交通流是我国城市交通的基本特征，也是造成城市交通拥堵的重要原因之一。特别是在平面信号交叉口，同相位不同方向行驶的机动车和自行车之间产生了大量的干扰，这些干扰严重影

学位

混合交通流穿越行为微观模型城市交通交通拥堵交叉口通行能力

恩施职院学生信息管理系统开发及应用研究

近年来，我国高等职业教育迎来了蓬勃发展的新局面，各高等职业学校招收大量新生，伴随着这种形势，学校学生管理负担越来越重。建立高性能的学生信息管理系统能够极大的提高学生信息

学位

学生信息管理系统系统建模数据库服务器高等职业教育面向对象校园网

新型舌象采集装置设计与颜色校正方法的研究

中医学是我国人民长期同疾病作斗争的经验总结和理论概括，以其独特的理论体系和临床疗效屹立于世界医学之林。然而长期以来，中医学一直独立发展，且主观性、随意性大。利用现代信

学位

舌象分析舌象仪颜色校正图像分析图像分割舌象采集

流媒体的速率反馈控制算法研究

随着多媒体技术的飞速发展，实时流媒体业务在Internet上的应用日益广泛。与传统的数据传输相比，这种业务对服务质量有严格的要求(如带宽，延迟，数据丢失)。目前，大多数实时流媒体业

学位

流媒体速率控制模糊PID算法

基于蚁群算法的多飞行器协同目标搜索航迹规划

无人飞行器目标搜索在军事和民用方面都有着越来越重要的应用。多架无人飞行器协同完成目标搜索任务相比于单架无人飞行器可以提高任务完成的质量和效率，缩短任务完成时间，增加

学位

无人飞行器目标搜索协同控制航迹规划蚁群算法

无拖曳控制系统的自适应神经网络控制器设计

为了探讨天文动力学、探测地球引力波、确定地球重力场，必须保证人造卫星精确地沿低轨道运行，即无拖曳卫星。其中的无拖曳控制系统旨在通过推进器来对非保守力，即干扰（包括大气阻

学位

无拖曳卫星自适应控制RBF神经网络反步法关联系统

基于GA-RBF网络广义预测控制在大型循环流化床机组中的应用

目前的火力发电产业中，煤粉炉始终占主导地位，但使用清洁能源是社会发展的必然要求，同时也是社会发展必然趋势，因此循环流化床锅炉燃烧技术应运而生。循环流化床锅炉独特的燃烧方

学位

遗传算法RBF神经网络广义预测控制循环流化床

分布式搜索引擎设计与实现

与本文相关的学术论文